網易首頁 > 網易號 > 正文申請入駐

國內首顆端邊大模型存算一體AI芯片發布，后摩智能吳強：具身機器人發展處于早期

2025-07-27 13:18:09　來源: 鈦媒體APP

北京舉報

分享至

7月27日消息，2025世界人工智能大會暨人工智能全球治理高級別會議（WAIC 2025）正在舉行。

本屆WAIC以“智能時代同球共濟”為主題，來自30余個國家和地區的1200余位嘉賓齊聚滬上，其中包括12位圖靈獎、諾貝爾獎得主，80多位中外院士，以及多個國際頂尖實驗室代表；展廳方面，展覽面積首次突破7萬平方米，吸引800多家企業參展，集中發布3000余項前沿展品，包括40余款大模型、50余款AI終端產品、60余款智能機器人及100余款“全球首發”或“中國首秀”新品。

WAIC大會期間，國內端邊大模型AI芯片公司后摩智能發布了全新端邊大模型 AI 芯片——后摩漫界M50，同步推出力擎系列M.2卡、力謀系列加速卡及計算盒子等硬件組合，形成覆蓋移動終端與邊緣場景的完整產品矩陣。

這是國內首顆面向端邊大模型的存算一體AI芯片。M50芯片實現了160TOPS（INT8）、100TFLOPS（bFP16）的物理算力，搭配最大48GB內存與153.6 GB/s的超高帶寬，典型功耗僅10W，相當于手機快充的功率，就能讓PC、智能語音設備、機器人等智能移動終端高效運行1.5B到70B（700億）參數的本地大模型。和傳統架構相比，M50 的能效提升5-10倍，真正實現“高算力、低功耗、即插即用”。

會后媒體交流時，后摩智能CEO吳強表示，目前公司研發的端邊推理加速卡可以適配從7B到70B的DeepSeek模型，芯片上限大約在100B（1000億）參數規模，并且在與中國移動一起研發一體機產品。他認為，具身智能機器人更像是十年前的智能駕駛，這一賽道發展才剛剛開始，這是一個很大的新興垂直賽道，格局還未定，大家依然有機會，一旦具身智能機器人發展起來，肯定比智能駕駛要大很多。“具身智能是我們的機會之一。”

據悉，后摩智能成立于2020年，致力于利用先進存儲器件等技術做存算一體大算力智駕芯片，提供高能效比、低成本芯片及解決方案。公司創始人吳強畢業于美國普林斯頓大學，早前曾在AMD、Facebook公司任職，此前是地平線公司CTO，團隊碩博占比達70%以上。

實際上，所謂存算一體（Computing in Memory）指的是在存儲器中嵌入計算能力，以新的運算架構進行二維和三維矩陣乘法/加法運算。與以往的馮諾依曼架構相比，其打破了由于計算單元與存儲單元過于獨立而導致的“存儲墻”，解決算力發展速度遠超存儲、存儲帶寬限制計算系統的速度等問題，成為后摩爾時代下新的技術發展路徑。

公開數據顯示，預計到2030年，中國存算一體芯片市場規模將超過1100億元。

成立至今，后摩智能已完成四輪融資，投資方包括紅杉資本中國基金、啟明創投、經緯創投、聯想創投、和玉資本、金浦投資等機構。最近一輪是在2024年7月，后摩智能宣布完成數億元人民幣的戰略融資，由中國移動旗下北京中移數字新經濟產業基金、上海中移數字轉型產業基金共同對公司進行投資。

鴻途H30發布兩年之后，后摩智能全面轉型和聚焦端邊大模型AI算力賽道，其研發的端邊AI芯片，將廣泛應用于Pad、PC、智能語音設備、機器人等多種終端，以及一體機、計算盒子、工作站等智能邊緣設備上，落地于消費終端、智能辦公、智能工業等領域場景。

吳強坦言，這個轉型過程非常痛苦，主要是認為存算一體和大模型有很多契合點。

“其實很多人問我為什么要轉變，而從2023年下半年開始，我覺得智能駕駛這個賽道有可能走不通，當時整個自動駕駛賽道非常卷，格局逐漸穩定，給新入局的機會越來越少。為了體現存算一體的優勢，所以一代芯片算力做得很大，但忽略了當時的市場需求，算力大就意味著成本高，而2023年行業都在講價格、講低成本，我們那個算力太超前、太冗余了，今天大家還會講幾百T和高階，那個階段不相信L3，很多業內人士說L3永遠不會到來，都在拼算力成本，當時芯片和市場需求有很大Gap（差距）。所以，如果我們做一個新的芯片擠入智能駕駛，市場窗口就又錯過了，當時新入局的機會越來越少，我在想要不要轉變，當時非常痛苦。研發非常痛苦，大家不愿意，而對我來講也很痛苦，大家會質疑你為何沒有堅持到底，但又明顯知道自動駕駛芯片賽道走不通。最后，還是生存的壓力大于面子，我們選擇轉型，我認為端邊大模型有很大的新興機會，并沒有什么巨頭在里面。2024年初，我們快速把第一代芯片調整了一版推出M30，后來中國移動對我們幫助很大，用M30運行600億參數大模型，給了我們更多信心，認為存算一體和大模型有契合，最后轉到這個方向并開始規劃，用時不到兩年的時間。”吳強稱。

談到新的產品，吳強表示，力謀LM5050 加速卡與力謀LM5070 加速卡分別集成 2 顆、4顆M50芯片，為單機及超大模型推理提供高密度算力，最高可達640TOPS。此外，M50芯片的存算一體技術從SRAM-CIM，到DRAM-PIM，一直在探索DRAM-PIM的產品化。

展望未來，吳強強調，后摩智能已啟動下一代DRAM-PIM技術的AI芯片研發，通過將計算單元直接嵌入DRAM陣列，使計算與存儲的協同更加緊密高效，而且能效較現有水平再提升三倍，推動百億參數大模型在終端設備實現普及，讓更強大的 AI 算力能夠融入PC、平板等日常設備。該芯片預計最快于2026年對外發布。

“M50的發布只是一個開始，我們的目標是讓大模型算力像電力一樣隨處可得、隨取隨用，真正走進每一條產線、每一臺設備、每一個人的指尖。”吳強稱。

（本文首發于鈦媒體App，作者｜林志佳，編輯｜蓋虹達）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.