—— ·要點速覽· ——
1、小米首款 3nm 旗艦處理器:玄戒O1 發布
2、昆侖萬維天工超級智能體今日上線,官方稱用戶使用量過大致卡塞將限流
3、Meta 推出 J1 系列模型:革新 LLM-as-a-Judge,打造最強“AI 法官”
4、硅谷AI新星flowith推出Agent Neo再掀試用熱潮,長程復雜任務表現優異
5、阿里國際聯合上海人工智能實驗室、北京語言大學發布首個應用型AI翻譯評測榜單
6、AI智能體概念局部異動 昆侖萬維漲超10%
1、智能機器人研發制造商「大咖機器人」完成20萬人民幣股權投資,投資方為潤中國際控股。
大咖機器人是一家智能機器人研發制造商,主要從事智能機器人的研發、設計、制造及銷售業務。
2、AI算力平臺研發商「蘇煜云」完成3000萬人民幣A輪融資,由冠峰資本領投。
蘇煜云是一家AI算力平臺研發商,以前沿技術融合為核心戰略,打造“邊緣云計算 +AI智能引擎+混合云管理”的協同架構,公司產品邊緣云網絡:已在全球部署200+分布式節點,覆蓋北美、東南亞、歐洲等關鍵區域,通過智能路由算法將內容傳輸距離縮短至500公里內,為音視頻、在線教育等場景提供端到端延遲<50ms的傳輸保障。AI算力中臺:集成自研的異構計算框架,支持CPU/GPU/FPGA資源動態調度。混合云管理:推出跨云統一管理平臺,兼容阿里云、 華為云等主流云服務接口,實現私有云與公有云資源的分鐘級彈性擴容。
3、AI擰緊機器人廠商「AI擰緊機器人廠商」完成數千萬人民幣種子輪融資,投資方為梅花創投。
頂配機器人是一家AI擰緊機器人廠商,聚焦工業制造中螺絲擰緊這一通用工藝環節,自主研發四六軸擰緊專用機器人、智能擰緊工具及擰緊機器人工作站,產品已批量導入比亞迪、科沃斯、欣旺達等行業頭部客戶。
4、智能助聽器研發生產商「博音聽力」完成數千萬人民幣B+輪融資,投資方為國發創投。
博音聽力是一家智能助聽器研發生產商,投資健康產業為主,專注發展“AI智能直銷+聽力專家中心”并成為美國貝爾通品牌助聽器在特定區域和渠道的獨家代理商,旗下目前擁有貝聆美、隨音聽等自主品牌。
1、小米首款 3nm 旗艦處理器:玄戒O1 發布
5月22日晚,小米 15 周年戰略新品發布會上發布了小米首款自主研發設計的旗艦處理器:玄戒O1。
玄戒O1 采用先進的「第二代 3nm 工藝」,內部集成雙超大核的 10 核 CPU 和超大規模的 16 核 GPU,性能非常強勁。實驗室安兔兔跑分達到了 300 萬分以上。
玄戒O1 的規模和工藝都與蘋果最先進的 A18 Pro 處理器一樣,通過 3nm 最先進的量產工藝制程,將超強性能、190 億超大規模晶體管匯集在只有 109mm2 的芯片面積上,相當于一個指甲蓋的大小。
玄戒O1 的 CPU 采用 10 核 4 叢集架構,擁有兩顆 Arm 最新最強的 Cortex-X925 超大核,四顆最新的 A725 性能大核、兩顆低頻 A725 能效大核和兩顆 A520 超級能效核心,可以很好的兼顧峰值爆發性能和日用能效。
玄戒O1 采用 Arm 最新 Cortex-X925 超大核處理器,相比上一代性能提升 36%,而且最高主頻達到了驚人的 3.9GHz。
玄戒O1 的 GPU 可以根據實際場景動態切換工作狀態。重載游戲時,全核全速運行;輕載游戲時,只開啟部分核心;繪制完一幀就休眠,等下一幀繪制再喚醒,在幀間實現微秒級的狀態切換;長時間不用 GPU,GPU 全部下電。(小米公司)
2、昆侖萬維天工超級智能體上線,官方稱用戶使用量過大致卡塞將限流
5 月 22 日消息,昆侖萬維今日面向全球市場,同步發布天工超級智能體(Skywork Super Agents)。這款產品采用了 AI agent 架構和 deep research 技術,能夠一站式生成文檔、PPT、表格(excel)、網頁、播客和音視頻多模態內容。據介紹,其 deep research 能力在 GAIA 榜單上排名全球第一,超過了 OpenAI Deep Research 和 Manus。
昆侖萬維今日午間發布天工智能體限流通知:“5 月 22 日上午,昆侖萬維天工超級智能體(Skywork Super Agents)上線后,由于用戶使用量過大,導致卡塞,我們會采取限流措施,請大家理解,感謝支持。”
查詢獲悉,天工超級智能體提供 5 個專家級 agents 和 1 個通用 agent。其中5 個專家智能體,分別專注于專業文檔(doc)、PPT、表格(excel)、播客和網頁的生成;1 個通用智能體接入了數十個 MCP,包括能夠熟練地處理多模態創意任務,用于生成諸如圖片、海報、音樂、MV、宣傳片、有聲讀物、繪本和其他多媒體內容。
目前,天工(Skywork)已將其 deep research agent 框架開源,開發者可在 github 上下載。同時,天工(Skywork)將他們的文檔、PPT、表格生成能力封裝成 MCP,供開發者使用。(IT之家)
3、Meta 推出 J1 系列模型:革新 LLM-as-a-Judge,打造最強“AI 法官”
5 月 22 日消息,科技媒體 marktechpost 21日發布博文,報道稱 Meta 公司推出 J1 系列模型,通過強化學習和合成數據訓練,顯著提升判斷模型準確性和公平性。
大型語言模型(LLM)正在突破傳統角色,逐步承擔起評估與判斷的重任。這種“LLM-as-a-Judge”的模式,讓 AI 模型能夠審查其他語言模型的輸出,成為強化學習、基準測試和系統對齊的重要工具。
不同于傳統的獎勵模型直接打分,判斷模型通過內部鏈式推理(chain-of-thought reasoning)模擬人類思考,特別適合數學解題、倫理推理和用戶意圖解讀等復雜任務,還能跨語言和領域驗證回應,推動語言模型開發的自動化和擴展性。
不過“LLM-as-a-Judge”模式目前面臨的挑戰是一致性差和推理深度不足,許多系統依賴基本指標或靜態標注,無法有效評估主觀或開放性問題;另一個問題就是位置偏見(position bias)答案順序常影響最終判斷,損害公平性。
此外,大規模收集人工標注數據成本高昂且耗時,限制了模型的泛化能力。EvalPlanner 和 DeepSeek-GRM 等現有解決方案依賴人工標注或僵化訓練模式,適應性有限。
為解決上述問題,Meta 的 GenAI 和 FAIR 團隊研發了 J1 模型。J1 通過強化學習框架訓練,采用可驗證的獎勵信號學習,使用 22000 個合成偏好對(包括 17000 個 WildChat 語料和 5000 個數學查詢)構建數據集,訓練出 J1-Llama-8B 和 J1-Llama-70B 兩款模型。
團隊還引入 Group Relative Policy Optimization(GRPO)算法,簡化訓練過程,并通過位置無關學習(position-agnostic learning)和一致性獎勵機制消除位置偏見。
J1 支持多種判斷格式,包括成對判斷、評分和單項評分,展現出極高的靈活性和通用性。
測試結果顯示,J1 模型性能大幅領先。在 PPE 基準測試中,J1-Llama-70B 準確率達 69.6%,超越 DeepSeek-GRM-27B(67.2%)和 EvalPlanner-Llama-70B(65.6%);即便是較小的 J1-Llama-8B,也以 62.2% 的成績擊敗 EvalPlanner-Llama-8B(55.5%)。
J1 還在 RewardBench、JudgeBench 等多個基準測試中展現出頂級表現,證明其在可驗證和主觀任務上的強大泛化能力,表明推理質量而非數據量,是判斷模型精準的關鍵。(IT之家)
4、硅谷AI新星flowith推出Agent Neo再掀試用熱潮,長程復雜任務表現優異
5月22日消息,由中國創業者成立于硅谷的人工智能公司flowith近日推出新的AI Agent:Neo。Agent Neo優勢在于可以智能指揮多種大模型完成長程復雜任務。發布后,其GitHub倉庫(flowith/neo-agent)迅速獲得3000+星,在開發者社區掀起熱潮。
據介紹,Agent Neo具備三大特性,即無限步驟、無限上下文、無限工具。“無限步驟”機制讓Neo能夠執行長序列、多階段的復雜任務,支持任務進程無限延長并實時更新狀態。“無限上下文”特性賦予Neo情景理解與長效記憶能力,并能保障任務全程連貫性,10M token上下文窗口可處理超大規模數據。“無限工具”意味著Neo通過Oracle框架,可動態調用無限數量的工具,包括圖像生成、聯網搜索和提示詞優化等;此外,其API集成能力可理解并調用外部API,鏈接第三方服務和企業內部系統。不過據反饋,Neo在處理超長任務時或面臨云端成本上升問題,其對網絡穩定性的要求較高,以及高并發任務有待優化,對于僅需簡單問答的輕度用戶,傳統聊天機器人仍是更經濟選擇。(鈦媒體)
5、阿里國際聯合上海人工智能實驗室、北京語言大學發布首個應用型AI翻譯評測榜單
由阿里國際聯合上海人工智能實驗室、北京語言大學一起制定的AI翻譯測評榜單TransBench在OpenCompass上線。與傳統的翻譯測評體系相比,增加了幻覺率、文化禁忌詞、敬語規范等指標,并首次針對行業的細分領域構建評測數據和評測方法。這些指標均來自真實場景的使用反饋,測評方法也已開源。(36氪)
1、AI智能體概念局部異動 昆侖萬維漲超10%
AI智能體概念局部異動,昆侖萬維漲超10%、創意信息、彩訊股份、焦點科技、南興股份、酷特智能等跟漲。消息面上,昆侖萬維宣布面向全球市場,同步發布天工超級智能體。這款產品采用了AI agent架構和deep research技術,能夠一站式生成文檔、PPT、表格(excel)、網頁、播客和音視頻多模態內容。 (財聯社 )
“ 在AI浪潮席卷一切的今天,我們是否可以期待另一種可能?'AI影子幕僚',成為CEO的“第二大腦”?”
更多干貨分享敬請關注我們的公眾號與視頻號~超多精彩對話內容等待您的解鎖!
掃碼加入【極新】科技行業交流群,探索科技前沿趨勢,本群適合創始人、CXO、行業高管。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.