《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > Meta訓練Llama 3遭遇頻繁故障

Meta訓練Llama 3遭遇頻繁故障

16384 塊 H100 GPU 訓練集群每 3 小時“罷工”一次
2024-07-29
來源:IT之家
關鍵詞: META Llama3 H100GPU

7 月 28 日消息,Meta 發布的一份研究報告顯示,其用于訓練 4050 億參數模型 Llama 3 的 16384 個英偉達 H100 顯卡集群在 54 天內出現了 419 次意外故障,平均每三小時就有一次。其中,一半以上的故障是由顯卡或其搭載的高帶寬內存(HBM3)引起的。

0.png

由于系統規模巨大且任務高度同步,單個顯卡故障可能導致整個訓練任務中斷,需要重新開始。盡管如此,Meta 團隊還是保持了 90% 以上的有效訓練時間。

在為期 54 天的預訓練中,共出現了 466 次工作中斷,其中 47 次是計劃中斷,419 次是意外中斷。計劃內的中斷是由于自動化維護造成的,而意外的中斷則主要源于硬件問題。 GPU 問題是導致故障的主要原因,占意外中斷的 58.7%。其中只有三起事件需要大量人工干預,其余的由自動化管理。

0.png

在 419 個意外中斷中,148 個(30.1%)是由各種 GPU 故障(包括 NVLink 故障)引起的,而 72 個(17.2%)是由 GPU 的 HBM3 內存故障引起的。有趣的是,54 天內只有兩個 CPU 發生故障。41.3% 的意外中斷是由多種因素造成的,包括軟件錯誤、網絡電纜和網絡適配器。

為提高效率,Meta 團隊開發了一系列工具和優化策略,包括縮短任務啟動和檢查點時間、利用 PyTorch 的 NCCL 飛行記錄器診斷性能問題、識別拖后顯卡等。此外,Meta 還關注到了環境因素的影響,如午間溫度波動對 GPU 性能的輕微影響,以及巨量 GPU 同時運行對數據中心電網的巨大壓力。

然而,隨著人工智能模型參數量的不斷增加,所需的計算資源也隨之擴大。以 xAI 計劃中的 10 萬塊 H100 顯卡集群為例,故障率可能會成倍增長,給未來的 AI 訓練帶來更大的挑戰。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲精品欧美专区| 久久国产婷婷国产香蕉| 亚洲欧美日韩一区二区三区在线| 91久久精品视频| 狠狠操狠狠色综合网| 国产午夜精品视频| 国产欧美日韩91| 国产精品嫩草99a| 欧美日韩综合在线免费观看| 欧美精品午夜| 欧美日韩亚洲另类| 欧美日韩亚洲一区二| 欧美日韩国产在线| 欧美日韩一区二区免费视频| 欧美喷潮久久久xxxxx| 欧美激情一区二区三区在线| 欧美精品www在线观看| 欧美区一区二| 欧美三级在线| 国产精品嫩草99av在线| 国产精品免费看久久久香蕉| 国产精品区二区三区日本 | 欧美资源在线观看| 久久国产精品99国产精| 久久免费高清| 老司机午夜免费精品视频| 美女91精品| 欧美激情综合在线| 欧美日一区二区在线观看| 国产精品电影观看| 国产丝袜一区二区| 韩国美女久久| 亚洲国产乱码最新视频| 亚洲精品一区二区三区蜜桃久 | 亚洲欧美视频在线| 久久成人国产精品| 亚洲国产天堂久久综合网| 亚洲精品中文字| 亚洲一级影院| 欧美在线视屏| 嫩草影视亚洲| 欧美日韩国产首页| 国产精品网站视频| 一区在线免费观看| 亚洲免费成人| 亚洲欧美国内爽妇网| 久久精品国产亚洲aⅴ| 亚洲日本中文字幕免费在线不卡| 一二三区精品| 欧美亚洲免费在线| 免费日韩精品中文字幕视频在线| 欧美日韩视频专区在线播放| 国产麻豆精品theporn| 在线观看国产成人av片| 一区二区三区高清在线观看| 欧美一区二区三区日韩| 亚洲精选视频在线| 午夜亚洲伦理| 蜜臀91精品一区二区三区| 欧美性jizz18性欧美| 国内一区二区在线视频观看| 亚洲日本欧美天堂| 香蕉久久夜色精品| 亚洲乱码国产乱码精品精可以看 | 日韩视频一区二区在线观看 | 欧美影视一区| 一区二区三区日韩欧美精品| 欧美一区在线直播| 欧美欧美午夜aⅴ在线观看| 国产日韩精品电影| 亚洲人成网在线播放| 欧美一级大片在线免费观看| 日韩午夜在线视频| 久久精品在线免费观看| 欧美日韩精品欧美日韩精品 | 日韩午夜电影av| 久久高清免费观看| 亚洲在线中文字幕| 免费在线亚洲| 国产午夜精品视频| 在线中文字幕日韩| 亚洲精品在线电影| 久久久免费av| 国产精品久久毛片a| 亚洲福利视频专区| 欧美综合二区| 午夜视频在线观看一区二区| 欧美日韩国产在线| 亚洲成人在线视频网站| 欧美亚洲在线播放| 亚洲午夜影视影院在线观看| 欧美成年人网| 激情一区二区| 午夜国产精品影院在线观看| 中国日韩欧美久久久久久久久| 美国十次成人| 国内精品模特av私拍在线观看| 亚洲视频免费在线| 一本久道久久综合狠狠爱| 毛片基地黄久久久久久天堂| 国产无一区二区| 亚洲一区激情| 亚洲无线一线二线三线区别av| 欧美黄色aa电影| 激情六月婷婷综合| 欧美一区二区日韩| 欧美在线视频一区| 国产精品日韩一区| 夜夜狂射影院欧美极品| 夜夜爽夜夜爽精品视频| 欧美成人免费网| 在线精品亚洲一区二区| 性色av一区二区三区| 欧美一进一出视频| 国产精品卡一卡二| 亚洲愉拍自拍另类高清精品| 亚洲一区二区三区免费视频| 欧美日韩亚洲综合在线| 日韩午夜在线观看视频| 亚洲美女尤物影院| 欧美激情综合在线| 亚洲人www| 一区二区精品在线| 欧美日韩免费高清| 99成人在线| 亚洲色在线视频| 欧美三日本三级少妇三2023| 一本大道久久a久久精品综合| 亚洲视频精选在线| 国产精品成人免费精品自在线观看| 99精品视频一区二区三区| 中文在线资源观看网站视频免费不卡 | 日韩午夜三级在线| 欧美视频在线播放| 亚洲一区二区三区精品在线| 羞羞色国产精品| 韩国三级电影一区二区| 亚洲国产高清一区| 国内在线观看一区二区三区| 黄色成人91| 亚洲国产一区二区视频| 另类尿喷潮videofree| 在线精品一区| 亚洲精品一区二区三区四区高清| 欧美aaaaaaaa牛牛影院| 亚洲精品亚洲人成人网| 亚洲欧美久久| 国产亚洲欧美日韩精品| 亚洲国产精品免费| 欧美精品综合| 在线综合亚洲欧美在线视频| 午夜久久久久久| 国产真实乱子伦精品视频| 亚洲经典一区| 欧美视频在线观看一区二区| 亚洲与欧洲av电影| 久久亚洲春色中文字幕| 亚洲国产日韩精品| 亚洲一区在线免费观看| 国产日韩精品一区| 亚洲人成在线影院| 国产精品国产三级国产专播品爱网| 香蕉久久夜色精品国产使用方法| 噜噜噜91成人网| 亚洲乱码国产乱码精品精天堂| 亚洲你懂的在线视频| 国内一区二区三区在线视频| 日韩视频免费大全中文字幕| 国产精品欧美一区喷水| 久久国产精品亚洲va麻豆| 欧美激情性爽国产精品17p| 一本色道久久综合亚洲精品高清 | 亚洲精品日韩一| 欧美一区午夜精品| 亚洲国产另类精品专区| 亚洲欧美日韩精品在线| 影音先锋欧美精品| 亚洲欧美视频在线观看| 在线免费不卡视频| 亚洲天堂av在线免费| 加勒比av一区二区| 亚洲自拍偷拍福利| 亚洲成人资源网| 性做久久久久久| 亚洲精品影院| 久久亚洲综合色| 亚洲特色特黄| 欧美激情精品久久久久久久变态| 亚洲男人第一网站| 欧美日韩成人网| 久久国产欧美日韩精品| 国产精品久久久久久久久免费桃花 | 久久国产精品色婷婷| 亚洲精品视频免费| 久久婷婷国产麻豆91天堂| 亚洲视频综合| 欧美喷潮久久久xxxxx| 久久精品国产69国产精品亚洲| 欧美体内谢she精2性欧美| 亚洲娇小video精品|