—— ·要點速覽· ——
1、小米首款 3nm 旗艦處理器:玄戒O1 發(fā)布
2、昆侖萬維天工超級智能體今日上線,官方稱用戶使用量過大致卡塞將限流
3、Meta 推出 J1 系列模型:革新 LLM-as-a-Judge,打造最強“AI 法官”
4、硅谷AI新星flowith推出Agent Neo再掀試用熱潮,長程復(fù)雜任務(wù)表現(xiàn)優(yōu)異
5、阿里國際聯(lián)合上海人工智能實驗室、北京語言大學(xué)發(fā)布首個應(yīng)用型AI翻譯評測榜單
6、AI智能體概念局部異動 昆侖萬維漲超10%
1、智能機器人研發(fā)制造商「大咖機器人」完成20萬人民幣股權(quán)投資,投資方為潤中國際控股。
大咖機器人是一家智能機器人研發(fā)制造商,主要從事智能機器人的研發(fā)、設(shè)計、制造及銷售業(yè)務(wù)。
2、AI算力平臺研發(fā)商「蘇煜云」完成3000萬人民幣A輪融資,由冠峰資本領(lǐng)投。
蘇煜云是一家AI算力平臺研發(fā)商,以前沿技術(shù)融合為核心戰(zhàn)略,打造“邊緣云計算 +AI智能引擎+混合云管理”的協(xié)同架構(gòu),公司產(chǎn)品邊緣云網(wǎng)絡(luò):已在全球部署200+分布式節(jié)點,覆蓋北美、東南亞、歐洲等關(guān)鍵區(qū)域,通過智能路由算法將內(nèi)容傳輸距離縮短至500公里內(nèi),為音視頻、在線教育等場景提供端到端延遲<50ms的傳輸保障。AI算力中臺:集成自研的異構(gòu)計算框架,支持CPU/GPU/FPGA資源動態(tài)調(diào)度。混合云管理:推出跨云統(tǒng)一管理平臺,兼容阿里云、 華為云等主流云服務(wù)接口,實現(xiàn)私有云與公有云資源的分鐘級彈性擴容。
3、AI擰緊機器人廠商「AI擰緊機器人廠商」完成數(shù)千萬人民幣種子輪融資,投資方為梅花創(chuàng)投。
頂配機器人是一家AI擰緊機器人廠商,聚焦工業(yè)制造中螺絲擰緊這一通用工藝環(huán)節(jié),自主研發(fā)四六軸擰緊專用機器人、智能擰緊工具及擰緊機器人工作站,產(chǎn)品已批量導(dǎo)入比亞迪、科沃斯、欣旺達等行業(yè)頭部客戶。
4、智能助聽器研發(fā)生產(chǎn)商「博音聽力」完成數(shù)千萬人民幣B+輪融資,投資方為國發(fā)創(chuàng)投。
博音聽力是一家智能助聽器研發(fā)生產(chǎn)商,投資健康產(chǎn)業(yè)為主,專注發(fā)展“AI智能直銷+聽力專家中心”并成為美國貝爾通品牌助聽器在特定區(qū)域和渠道的獨家代理商,旗下目前擁有貝聆美、隨音聽等自主品牌。
1、小米首款 3nm 旗艦處理器:玄戒O1 發(fā)布
5月22日晚,小米 15 周年戰(zhàn)略新品發(fā)布會上發(fā)布了小米首款自主研發(fā)設(shè)計的旗艦處理器:玄戒O1。
玄戒O1 采用先進的「第二代 3nm 工藝」,內(nèi)部集成雙超大核的 10 核 CPU 和超大規(guī)模的 16 核 GPU,性能非常強勁。實驗室安兔兔跑分達到了 300 萬分以上。
玄戒O1 的規(guī)模和工藝都與蘋果最先進的 A18 Pro 處理器一樣,通過 3nm 最先進的量產(chǎn)工藝制程,將超強性能、190 億超大規(guī)模晶體管匯集在只有 109mm2 的芯片面積上,相當(dāng)于一個指甲蓋的大小。
玄戒O1 的 CPU 采用 10 核 4 叢集架構(gòu),擁有兩顆 Arm 最新最強的 Cortex-X925 超大核,四顆最新的 A725 性能大核、兩顆低頻 A725 能效大核和兩顆 A520 超級能效核心,可以很好的兼顧峰值爆發(fā)性能和日用能效。
玄戒O1 采用 Arm 最新 Cortex-X925 超大核處理器,相比上一代性能提升 36%,而且最高主頻達到了驚人的 3.9GHz。
玄戒O1 的 GPU 可以根據(jù)實際場景動態(tài)切換工作狀態(tài)。重載游戲時,全核全速運行;輕載游戲時,只開啟部分核心;繪制完一幀就休眠,等下一幀繪制再喚醒,在幀間實現(xiàn)微秒級的狀態(tài)切換;長時間不用 GPU,GPU 全部下電。(小米公司)
2、昆侖萬維天工超級智能體上線,官方稱用戶使用量過大致卡塞將限流
5 月 22 日消息,昆侖萬維今日面向全球市場,同步發(fā)布天工超級智能體(Skywork Super Agents)。這款產(chǎn)品采用了 AI agent 架構(gòu)和 deep research 技術(shù),能夠一站式生成文檔、PPT、表格(excel)、網(wǎng)頁、播客和音視頻多模態(tài)內(nèi)容。據(jù)介紹,其 deep research 能力在 GAIA 榜單上排名全球第一,超過了 OpenAI Deep Research 和 Manus。
昆侖萬維今日午間發(fā)布天工智能體限流通知:“5 月 22 日上午,昆侖萬維天工超級智能體(Skywork Super Agents)上線后,由于用戶使用量過大,導(dǎo)致卡塞,我們會采取限流措施,請大家理解,感謝支持。”
查詢獲悉,天工超級智能體提供 5 個專家級 agents 和 1 個通用 agent。其中5 個專家智能體,分別專注于專業(yè)文檔(doc)、PPT、表格(excel)、播客和網(wǎng)頁的生成;1 個通用智能體接入了數(shù)十個 MCP,包括能夠熟練地處理多模態(tài)創(chuàng)意任務(wù),用于生成諸如圖片、海報、音樂、MV、宣傳片、有聲讀物、繪本和其他多媒體內(nèi)容。
目前,天工(Skywork)已將其 deep research agent 框架開源,開發(fā)者可在 github 上下載。同時,天工(Skywork)將他們的文檔、PPT、表格生成能力封裝成 MCP,供開發(fā)者使用。(IT之家)
3、Meta 推出 J1 系列模型:革新 LLM-as-a-Judge,打造最強“AI 法官”
5 月 22 日消息,科技媒體 marktechpost 21日發(fā)布博文,報道稱 Meta 公司推出 J1 系列模型,通過強化學(xué)習(xí)和合成數(shù)據(jù)訓(xùn)練,顯著提升判斷模型準(zhǔn)確性和公平性。
大型語言模型(LLM)正在突破傳統(tǒng)角色,逐步承擔(dān)起評估與判斷的重任。這種“LLM-as-a-Judge”的模式,讓 AI 模型能夠?qū)彶槠渌Z言模型的輸出,成為強化學(xué)習(xí)、基準(zhǔn)測試和系統(tǒng)對齊的重要工具。
不同于傳統(tǒng)的獎勵模型直接打分,判斷模型通過內(nèi)部鏈?zhǔn)酵评恚╟hain-of-thought reasoning)模擬人類思考,特別適合數(shù)學(xué)解題、倫理推理和用戶意圖解讀等復(fù)雜任務(wù),還能跨語言和領(lǐng)域驗證回應(yīng),推動語言模型開發(fā)的自動化和擴展性。
不過“LLM-as-a-Judge”模式目前面臨的挑戰(zhàn)是一致性差和推理深度不足,許多系統(tǒng)依賴基本指標(biāo)或靜態(tài)標(biāo)注,無法有效評估主觀或開放性問題;另一個問題就是位置偏見(position bias)答案順序常影響最終判斷,損害公平性。
此外,大規(guī)模收集人工標(biāo)注數(shù)據(jù)成本高昂且耗時,限制了模型的泛化能力。EvalPlanner 和 DeepSeek-GRM 等現(xiàn)有解決方案依賴人工標(biāo)注或僵化訓(xùn)練模式,適應(yīng)性有限。
為解決上述問題,Meta 的 GenAI 和 FAIR 團隊研發(fā)了 J1 模型。J1 通過強化學(xué)習(xí)框架訓(xùn)練,采用可驗證的獎勵信號學(xué)習(xí),使用 22000 個合成偏好對(包括 17000 個 WildChat 語料和 5000 個數(shù)學(xué)查詢)構(gòu)建數(shù)據(jù)集,訓(xùn)練出 J1-Llama-8B 和 J1-Llama-70B 兩款模型。
團隊還引入 Group Relative Policy Optimization(GRPO)算法,簡化訓(xùn)練過程,并通過位置無關(guān)學(xué)習(xí)(position-agnostic learning)和一致性獎勵機制消除位置偏見。
J1 支持多種判斷格式,包括成對判斷、評分和單項評分,展現(xiàn)出極高的靈活性和通用性。
測試結(jié)果顯示,J1 模型性能大幅領(lǐng)先。在 PPE 基準(zhǔn)測試中,J1-Llama-70B 準(zhǔn)確率達 69.6%,超越 DeepSeek-GRM-27B(67.2%)和 EvalPlanner-Llama-70B(65.6%);即便是較小的 J1-Llama-8B,也以 62.2% 的成績擊敗 EvalPlanner-Llama-8B(55.5%)。
J1 還在 RewardBench、JudgeBench 等多個基準(zhǔn)測試中展現(xiàn)出頂級表現(xiàn),證明其在可驗證和主觀任務(wù)上的強大泛化能力,表明推理質(zhì)量而非數(shù)據(jù)量,是判斷模型精準(zhǔn)的關(guān)鍵。(IT之家)
4、硅谷AI新星flowith推出Agent Neo再掀試用熱潮,長程復(fù)雜任務(wù)表現(xiàn)優(yōu)異
5月22日消息,由中國創(chuàng)業(yè)者成立于硅谷的人工智能公司flowith近日推出新的AI Agent:Neo。Agent Neo優(yōu)勢在于可以智能指揮多種大模型完成長程復(fù)雜任務(wù)。發(fā)布后,其GitHub倉庫(flowith/neo-agent)迅速獲得3000+星,在開發(fā)者社區(qū)掀起熱潮。
據(jù)介紹,Agent Neo具備三大特性,即無限步驟、無限上下文、無限工具。“無限步驟”機制讓Neo能夠執(zhí)行長序列、多階段的復(fù)雜任務(wù),支持任務(wù)進程無限延長并實時更新狀態(tài)。“無限上下文”特性賦予Neo情景理解與長效記憶能力,并能保障任務(wù)全程連貫性,10M token上下文窗口可處理超大規(guī)模數(shù)據(jù)。“無限工具”意味著Neo通過Oracle框架,可動態(tài)調(diào)用無限數(shù)量的工具,包括圖像生成、聯(lián)網(wǎng)搜索和提示詞優(yōu)化等;此外,其API集成能力可理解并調(diào)用外部API,鏈接第三方服務(wù)和企業(yè)內(nèi)部系統(tǒng)。不過據(jù)反饋,Neo在處理超長任務(wù)時或面臨云端成本上升問題,其對網(wǎng)絡(luò)穩(wěn)定性的要求較高,以及高并發(fā)任務(wù)有待優(yōu)化,對于僅需簡單問答的輕度用戶,傳統(tǒng)聊天機器人仍是更經(jīng)濟選擇。(鈦媒體)
5、阿里國際聯(lián)合上海人工智能實驗室、北京語言大學(xué)發(fā)布首個應(yīng)用型AI翻譯評測榜單
由阿里國際聯(lián)合上海人工智能實驗室、北京語言大學(xué)一起制定的AI翻譯測評榜單TransBench在OpenCompass上線。與傳統(tǒng)的翻譯測評體系相比,增加了幻覺率、文化禁忌詞、敬語規(guī)范等指標(biāo),并首次針對行業(yè)的細分領(lǐng)域構(gòu)建評測數(shù)據(jù)和評測方法。這些指標(biāo)均來自真實場景的使用反饋,測評方法也已開源。(36氪)
1、AI智能體概念局部異動 昆侖萬維漲超10%
AI智能體概念局部異動,昆侖萬維漲超10%、創(chuàng)意信息、彩訊股份、焦點科技、南興股份、酷特智能等跟漲。消息面上,昆侖萬維宣布面向全球市場,同步發(fā)布天工超級智能體。這款產(chǎn)品采用了AI agent架構(gòu)和deep research技術(shù),能夠一站式生成文檔、PPT、表格(excel)、網(wǎng)頁、播客和音視頻多模態(tài)內(nèi)容。 (財聯(lián)社 )
“ 在AI浪潮席卷一切的今天,我們是否可以期待另一種可能?'AI影子幕僚',成為CEO的“第二大腦”?”
更多干貨分享敬請關(guān)注我們的公眾號與視頻號~超多精彩對話內(nèi)容等待您的解鎖!
掃碼加入【極新】科技行業(yè)交流群,探索科技前沿趨勢,本群適合創(chuàng)始人、CXO、行業(yè)高管。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.