7月27日消息,2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)正在舉行。
本屆WAIC以“智能時代 同球共濟”為主題,來自30余個國家和地區的1200余位嘉賓齊聚滬上,其中包括12位圖靈獎、諾貝爾獎得主,80多位中外院士,以及多個國際頂尖實驗室代表;展廳方面,展覽面積首次突破7萬平方米,吸引800多家企業參展,集中發布3000余項前沿展品,包括40余款大模型、50余款AI終端產品、60余款智能機器人及100余款“全球首發”或“中國首秀”新品。
WAIC大會期間,國內端邊大模型AI芯片公司后摩智能發布了全新端邊大模型 AI 芯片——后摩漫界M50,同步推出力擎系列M.2卡、力謀系列加速卡及計算盒子等硬件組合,形成覆蓋移動終端與邊緣場景的完整產品矩陣。
這是國內首顆面向端邊大模型的存算一體AI芯片。M50芯片實現了160TOPS(INT8)、100TFLOPS(bFP16)的物理算力,搭配最大48GB內存與153.6 GB/s的超高帶寬,典型功耗僅10W,相當于手機快充的功率,就能讓PC、智能語音設備、機器人等智能移動終端高效運行1.5B到70B(700億)參數的本地大模型。和傳統架構相比,M50 的能效提升5-10倍,真正實現“高算力、低功耗、即插即用”。
會后媒體交流時,后摩智能CEO吳強表示,目前公司研發的端邊推理加速卡可以適配從7B到70B的DeepSeek模型,芯片上限大約在100B(1000億)參數規模,并且在與中國移動一起研發一體機產品。他認為,具身智能機器人更像是十年前的智能駕駛,這一賽道發展才剛剛開始,這是一個很大的新興垂直賽道,格局還未定,大家依然有機會,一旦具身智能機器人發展起來,肯定比智能駕駛要大很多。“具身智能是我們的機會之一。”
據悉,后摩智能成立于2020年,致力于利用先進存儲器件等技術做存算一體大算力智駕芯片,提供高能效比、低成本芯片及解決方案。公司創始人吳強畢業于美國普林斯頓大學,早前曾在AMD、Facebook公司任職,此前是地平線公司CTO,團隊碩博占比達70%以上。
實際上,所謂存算一體(Computing in Memory)指的是在存儲器中嵌入計算能力,以新的運算架構進行二維和三維矩陣乘法/加法運算。與以往的馮諾依曼架構相比,其打破了由于計算單元與存儲單元過于獨立而導致的“存儲墻”,解決算力發展速度遠超存儲、存儲帶寬限制計算系統的速度等問題,成為后摩爾時代下新的技術發展路徑。
公開數據顯示,預計到2030年,中國存算一體芯片市場規模將超過1100億元。
成立至今,后摩智能已完成四輪融資,投資方包括紅杉資本中國基金、啟明創投、經緯創投、聯想創投、和玉資本、金浦投資等機構。最近一輪是在2024年7月,后摩智能宣布完成數億元人民幣的戰略融資,由中國移動旗下北京中移數字新經濟產業基金、上海中移數字轉型產業基金共同對公司進行投資。
鴻途H30發布兩年之后,后摩智能全面轉型和聚焦端邊大模型AI算力賽道,其研發的端邊AI芯片,將廣泛應用于Pad、PC、智能語音設備、機器人等多種終端,以及一體機、計算盒子、工作站等智能邊緣設備上,落地于消費終端、智能辦公、智能工業等領域場景。
吳強坦言,這個轉型過程非常痛苦,主要是認為存算一體和大模型有很多契合點。
“其實很多人問我為什么要轉變,而從2023年下半年開始,我覺得智能駕駛這個賽道有可能走不通,當時整個自動駕駛賽道非常卷,格局逐漸穩定,給新入局的機會越來越少。為了體現存算一體的優勢,所以一代芯片算力做得很大,但忽略了當時的市場需求,算力大就意味著成本高,而2023年行業都在講價格、講低成本,我們那個算力太超前、太冗余了,今天大家還會講幾百T和高階,那個階段不相信L3,很多業內人士說L3永遠不會到來,都在拼算力成本,當時芯片和市場需求有很大Gap(差距)。所以,如果我們做一個新的芯片擠入智能駕駛,市場窗口就又錯過了,當時新入局的機會越來越少,我在想要不要轉變,當時非常痛苦。 研發非常痛苦,大家不愿意,而對我來講也很痛苦,大家會質疑你為何沒有堅持到底,但又明顯知道自動駕駛芯片賽道走不通。最后,還是生存的壓力大于面子,我們選擇轉型,我認為端邊大模型有很大的新興機會,并沒有什么巨頭在里面。2024年初,我們快速把第一代芯片調整了一版推出M30,后來中國移動對我們幫助很大,用M30運行600億參數大模型,給了我們更多信心,認為存算一體和大模型有契合,最后轉到這個方向并開始規劃,用時不到兩年的時間。”吳強稱。
談到新的產品,吳強表示,力謀LM5050 加速卡與力謀LM5070 加速卡分別集成 2 顆、4顆M50芯片,為單機及超大模型推理提供高密度算力,最高可達640TOPS。此外,M50芯片的存算一體技術從SRAM-CIM,到DRAM-PIM,一直在探索DRAM-PIM的產品化。
展望未來,吳強強調,后摩智能已啟動下一代DRAM-PIM技術的AI芯片研發,通過將計算單元直接嵌入DRAM陣列,使計算與存儲的協同更加緊密高效,而且能效較現有水平再提升三倍,推動百億參數大模型在終端設備實現普及,讓更強大的 AI 算力能夠融入PC、平板等日常設備。該芯片預計最快于2026年對外發布。
“M50的發布只是一個開始,我們的目標是讓大模型算力像電力一樣隨處可得、隨取隨用,真正走進每一條產線、每一臺設備、每一個人的指尖。”吳強稱。
(本文首發于鈦媒體App,作者|林志佳,編輯|蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.