近期有外媒報道稱,字節跳動計劃與臺積電展開合作,在2026年前開始量產其兩款基于5nm工藝的自研AI芯片,或將預定數十萬枚芯片的產量。
據悉,這兩款芯片分別針對模型訓練和推理設計。“訓練芯片”用于加速構建AI模型所需的大量數據計算;“推理芯片”則用于加速基于模型的預測和決策過程。這些芯片當前仍處于設計階段,其性能與英偉達即將發布的Blackwell架構芯片相當。
知情人士表示,通過生產自家研發的芯片,字節跳動可以減少對英偉達GPU的依賴,從而大幅降低AI模型開發和運營過程中的高額芯片采購成本,在中國AI聊天機器人市場上超過其競爭對手。
9月18日,字節跳動官方回應稱此報道不實。字節方面表示,公司確實在芯片領域進行了一定程度的探索,但仍處于初期階段,主要是圍繞推薦、廣告等業務的成本優化,所有項目也完全符合相關的貿易管制規定。
隨著中國AI產業的發展,本土AI開發商之間的競爭正在醞釀之中。
去年6月,字節推出旗下首款AI聊天機器人“豆包”,提供了類似于OpenAI ChatGPT的文本和圖像生成功能,并一度成為百度“文心一言”的強勁對手。統計數據顯示,“豆包”在中國大陸的iOS下載量和月活躍用戶均超過了“文心一言”。
今年5月,字節又陸續推出了一系列針對企業客戶的“豆包”大語言模型,得益于其低廉的開發與生產成本,其產品定價比OpenAI同類產品的價格低了將近99%,而競爭異常激烈的AI市場孕育了愈發嚴苛的價格戰,百度、阿里等中國科技巨頭紛紛將模型價格大幅下調,降幅高達97%。
與此同時,字節跳動在開發生成式AI模型方面的費用也在不斷上升,今年已訂購了超20萬顆英偉達H20芯片,訂單總金額超過20億美元,目前仍在等待英偉達交付全部訂單。
多年來,字節一直致力于推理芯片的研發工作,而設計訓練芯片的難度更大,成本也更高。
根據知情人士的解釋,字節此次芯片設計很大程度上是因為美國的出口限制(如AI芯片等關鍵技術的出口),而由于美國政府可能會不時更新相應條款,這些芯片的未來供應或將面臨合規風險。
H20是美國出口管制下允許出售給中國的最先進英偉達芯片,其性能是H100(英偉達當前最先進芯片)的四分之一,因此,國內廠商需要購買更多的H20來為單個集群實現同等算力,這無疑增加了成本。
在這種情況下,字節降低芯片成本至關重要。字節的芯片研發工作遵循了谷歌、亞馬遜和微軟等公司近年來的做法,即在開發和運行AI模型方面減少對英偉達芯片的依賴,部分公司還為其云計算服務的客戶提供了自家設計的芯片,作為英偉達芯片的替代品。
根據最新計劃,若字節自研芯片成功投入使用,將節省數十億美元的開支,公司也希望該芯片集群能夠以同等成本實現單個H100的四倍計算性能。據了解,H100芯片的價格最高可達3萬美元。
今年6月,有外媒報道稱字節正與博通合作開發一款5nm制程的ASIC芯片,該處理器將符合美國出口規定,由臺積電負責生產。雖設計工作順利進行,但“流片”工序遲遲未開始。此后,字節又否認了與博通合作的傳聞。
去年,字節還收購了華為的Ascend 910B芯片。
自研AI芯片之路上,字節并不是獨行者。近年來,騰訊、百度、阿里等國內互聯網巨頭均加大了在AI芯片領域的投資。據稱,百度的自研AI芯片“昆侖3”已進入設計的最后階段,即將交由臺積電開始生產。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.