2 月 13 日,文心一言在官網(wǎng)宣布將于 4 月 1 日 0 時(shí)起全面免費(fèi),所有 PC 端和 App 端用戶均可體驗(yàn)文心系列最新模型,以及超長(zhǎng)文檔處理、專(zhuān)業(yè)檢索增強(qiáng)、高級(jí)AI繪畫(huà)、多語(yǔ)種對(duì)話等功能。
同一時(shí)間,OpenAI 首席執(zhí)行官 Sam Altman 也公布了 GPT-4.5 和 GPT-5 的最新消息。免費(fèi)版 ChatGPT 能在標(biāo)準(zhǔn)智能設(shè)置下無(wú)限制地使用 GPT-5 進(jìn)行對(duì)話。
消息一出,不少網(wǎng)友下場(chǎng)直呼:AI 普惠的時(shí)代來(lái)臨了!
AI 科技評(píng)論一手實(shí)測(cè)對(duì)比了文心一言 3.5 與 4.0 的兩個(gè)版本的區(qū)別后,不禁感嘆,百度這波真的是誠(chéng)意滿滿了!
先是扔給大模型一個(gè)提示詞:請(qǐng)參照原文:“日照香爐生紫煙,遙看瀑布掛前川。”在新的主題上進(jìn)行仿寫(xiě):昆明湖仿寫(xiě)要求:模仿風(fēng)格及格式,寫(xiě)兩句詩(shī)。
文心一言 3.5 給的結(jié)果雖然工工整整,但僅有一句話,并沒(méi)有看到思考過(guò)程。
相比之下,文心一言 4.0 的回答就顯得全面很多。不僅分析了原文的詩(shī)詞意境和寫(xiě)作手法,更是對(duì)輸出的內(nèi)容進(jìn)行了一波全面分析,直觀且通俗易懂。
詩(shī)詞續(xù)寫(xiě)之外,再扔給文心一言一個(gè)腦洞大開(kāi)的問(wèn)題:世界八大奇跡哪一個(gè)最有可能是外星人建的,嚴(yán)謹(jǐn)?shù)赝评硪幌隆?/p>
文心一言 3.5 的回答中規(guī)中矩,并沒(méi)有給出明確的答案,字里行間透露著一種“朦朧感”。
而文心一言 4.0 則是正面回答了這個(gè)問(wèn)題,答案和分析過(guò)程都很直觀,除此之外還給出了富媒體內(nèi)容。
在圖片生成方面,兩個(gè)版本的文心一言在生成內(nèi)容上也有明顯差異。
同一個(gè)提示詞:“幫我畫(huà)一個(gè)奧黛麗赫本吃湯圓。”文心一言 3.5 給出了一張看起來(lái)“AI 味”滿滿的圖。
而文心一言 4.0 則是依托 IRAG 能力,生成了更準(zhǔn)確的人物臉部,沒(méi)有“AI 味”,更真實(shí)更準(zhǔn)確,并且一次生成了很多張。
大模型人人可用 :“免費(fèi)午餐”來(lái)了
經(jīng)過(guò)實(shí)測(cè),可以直觀的看出文心一言 4.0 版本相較于之前的 3.5 版本,已經(jīng)發(fā)生了質(zhì)的飛躍。這個(gè)版本不僅在語(yǔ)言理解和多模態(tài)能力上大幅提升,還新增了深度搜索等超強(qiáng)功能。
4.0 版本的文心一言,對(duì)專(zhuān)業(yè)咨詢類(lèi)問(wèn)題的解決能力進(jìn)行全面加強(qiáng),可以輕松應(yīng)對(duì)專(zhuān)業(yè)問(wèn)題查詢門(mén)檻高、查詢渠道專(zhuān)精、查詢結(jié)果分析難度大等使用挑戰(zhàn)。同時(shí)在民生、創(chuàng)業(yè)、經(jīng)濟(jì)分析等方面問(wèn)題,也能夠提供專(zhuān)家級(jí)的內(nèi)容回復(fù)。
除此之外,4.0 版本還具備了更全面的思考、規(guī)劃、反思能力,針對(duì)工具規(guī)劃及調(diào)用能力上進(jìn)行了全面加強(qiáng),能夠更加“聰明”的使用多個(gè)工具解決各類(lèi)復(fù)雜任務(wù)問(wèn)題。例如先搜索內(nèi)容,再配合代碼解釋器;或者閱讀上傳文檔、再搜索分析,最后綜合給出結(jié)果。
提升了用戶體驗(yàn)的同時(shí),也進(jìn)一步降低了人們?cè)谑褂?AI 方面的門(mén)檻。
而縱向?qū)Ρ纫幌卢F(xiàn)在市場(chǎng)上主流大模型的開(kāi)放能力,你會(huì)發(fā)現(xiàn)文心一言其實(shí)是一個(gè)“六邊形戰(zhàn)士”。
諸多衡量標(biāo)準(zhǔn)中,RAG 作為大模型競(jìng)爭(zhēng)的核心能力之一,是衡量大模型優(yōu)劣的重要維度。而百度在 RAG 的技術(shù)上具備中文深度理解、多模態(tài)檢索、垂直領(lǐng)域定制化以及實(shí)時(shí)數(shù)據(jù)整合能力等優(yōu)勢(shì),在中文互聯(lián)網(wǎng)、企業(yè)服務(wù)、政務(wù)等場(chǎng)景中具十足的實(shí)用性和競(jìng)爭(zhēng)力。
并且從 RAG 能力實(shí)測(cè)來(lái)看,國(guó)內(nèi)外主流大模型中,百度文心一言綜合表現(xiàn)最為亮眼。
但雷峰網(wǎng)回顧一下 AI 搜索相關(guān)的技術(shù)發(fā)展,其實(shí)本質(zhì)上都是對(duì) RAG 技術(shù)的延伸,在不斷的迭代中,文字層面的 RAG 技術(shù)已經(jīng)基本讓大模型消除了“幻覺(jué)”,但在多模態(tài)方面,尤其是圖像生成,RAG 技術(shù)的運(yùn)用還遠(yuǎn)遠(yuǎn)不夠了。
網(wǎng)上經(jīng)常可以看到各種大模型的文生圖功能產(chǎn)出的失敗案例,不僅一眼假,還往往背離物理邏輯,出現(xiàn)各種張冠李戴的“幻覺(jué)問(wèn)題”,充滿的“AI 味”。
而百度早就意識(shí)到了這一點(diǎn),在去年就自研了一種專(zhuān)門(mén)解決圖像生成幻覺(jué)問(wèn)題的iRAG技術(shù),早早地就走在了行業(yè)的最前面。
百度的iRAG 技術(shù)是一種結(jié)合檢索和生成的技術(shù)方法,用來(lái)提升生成內(nèi)容的可靠性和準(zhǔn)確性。它將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,進(jìn)而生成各種非常真實(shí)的圖片,呈現(xiàn)出來(lái)的效果是原始文生圖系統(tǒng)無(wú)法比擬的。
而 iRAG 讓生成的圖片沒(méi)有“AI 味”的同時(shí),也可以幫助用戶大大降低創(chuàng)作成本。總的來(lái)看,百度這波全面放開(kāi)文心一言的操作,真就是把最好的內(nèi)容拿給用戶了。
技術(shù)進(jìn)步與成本降低的雙重驅(qū)動(dòng)
毫無(wú)疑問(wèn),百度宣布文心一言全面開(kāi)放,是背后技術(shù)突破與成本降低的結(jié)果。
最近李彥宏在“世界政府峰會(huì)”上就表示:“在過(guò)去,當(dāng)我們談?wù)撃柖蓵r(shí),每 18 個(gè)月,性能水平或價(jià)格都會(huì)減半。但是今天,當(dāng)我們談?wù)摯笮驼Z(yǔ)言模型時(shí),增加的成本基本上降低了,可以在 12 個(gè)月內(nèi)降低 90% 以上。”
在訓(xùn)練成本方面,百度通過(guò)昆侖芯的高性價(jià)比,減少了計(jì)算資源的需求,從而降低了算力成本。同時(shí),百度智能云的萬(wàn)卡集群(計(jì)劃擴(kuò)展至 3萬(wàn)卡)利用規(guī)模效應(yīng),提高了資源的利用率,避免算力閑置,提升了計(jì)算效率。
百舸平臺(tái)則通過(guò)高性能網(wǎng)絡(luò)和創(chuàng)新散熱方案,優(yōu)化了大規(guī)模集群的部署和管理,提升了通信效率,降低了能耗。
為了解決大模型訓(xùn)練時(shí)對(duì)高通信帶寬的需求,百度建設(shè)了超大規(guī)模 HPN 高性能網(wǎng)絡(luò),通過(guò)優(yōu)化的擁塞控制算法和集合通信策略,提升了通信效率,將帶寬有效性提升至 90% 以上。同時(shí),由于萬(wàn)卡集群能耗高,百舸采用了創(chuàng)新的散熱方案,有效降低了能耗,從而減少了電力成本。
為了提升 GPU 的有效利用率,百舸還不斷優(yōu)化分布式訓(xùn)練策略,通過(guò)高效并行化任務(wù)切分將訓(xùn)練主流開(kāi)源模型的集群 GPU 有效利用率(MFU)提升至 58%。百舸還提供了全面的故障診斷手段,通過(guò)百度自研的BCCL(百度集合通信庫(kù))快速定位和修復(fù)故障,保障訓(xùn)練任務(wù)的穩(wěn)定性,將故障恢復(fù)時(shí)間從小時(shí)級(jí)縮短到分鐘級(jí),確保集群的有效訓(xùn)練率達(dá)到98%。
除此之外,有分析人士猜測(cè),文心一言全面開(kāi)放的一個(gè)關(guān)鍵原因是推理成本的持續(xù)降低。
他們指出,百度在模型推理部署方面具有明顯優(yōu)勢(shì),特別是在飛槳深度學(xué)習(xí)框架的支持下,飛槳的并行推理和量化推理等自研技術(shù)大大提升了推理性能,并有效降低了推理成本。飛槳與文心的深度優(yōu)化協(xié)同作用,使得推理的效率得到了進(jìn)一步提高,同時(shí)降低了相關(guān)成本。
全民狂歡:開(kāi)放促進(jìn)AI普惠
短短 2 月 13 日一天之內(nèi),OpenAI、百度兩家 AI 大廠同時(shí)宣布全面開(kāi)放自家大模型產(chǎn)品。
北京時(shí)間 2 月 7 日,OpenAI 宣布 ChatGPT Search 向所有人開(kāi)放,無(wú)需注冊(cè),來(lái)到 OpenAI 官網(wǎng)首頁(yè)就可以直接使用搜索功能。幾小時(shí)之后,谷歌也宣布向所有人開(kāi)放最新 Gemini 2.0 模型,包括 Flash、Pro Experimental 和 Flash-Lite 三個(gè)版本。
頭部大廠的各種操作,隱約中讓人們慢慢看清了大模型行業(yè)未來(lái)的發(fā)展趨勢(shì):全面開(kāi)放。
AI 技術(shù)的開(kāi)放不僅能夠降低技術(shù)的門(mén)檻,也可以讓越來(lái)越多的用戶和開(kāi)發(fā)者能夠直接接觸到這些強(qiáng)大的模型和工具。同時(shí),開(kāi)放也意味著 AI 將更廣泛地滲透到各行各業(yè),影響日常生活和工作模式。
或許隨著越來(lái)越多的企業(yè)加入到開(kāi)放大模型的行列,AI 的應(yīng)用場(chǎng)景將變得更加多元化,技術(shù)門(mén)檻會(huì)逐步降低,甚至可能形成一個(gè)更加開(kāi)放和共享的 AI 生態(tài)。
而這場(chǎng)由百度、OpenAI等頭部大廠引領(lǐng)的 AI 大模型開(kāi)放浪潮,雷峰網(wǎng)看到也許僅僅是未來(lái)更大規(guī)模開(kāi)放的開(kāi)始,但在這個(gè)過(guò)程中,不僅是 AI 技術(shù)的推進(jìn),更是 AI 向人類(lèi)社會(huì)的深度融合,進(jìn)而帶來(lái)的更廣泛的創(chuàng)新機(jī)會(huì)與發(fā)展空間。
AI 普惠的時(shí)代,真的來(lái)臨了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.