這幾天,你是否刷到過大火的各地博物館讓文物“舞動起來”的短視頻?
又是否看到過讓馬斯克都直呼驚嘆的,那些被“復活”的世界名畫?
再或者,你一定看到過AI魔改過爭議很多的老牌影視劇。
是的,這一切背后都是AI。
就在2024年最后一個月,國內外科技大廠更是集體炫技,AI應用正在以迅雷不及掩耳之勢加速落地。
在人工智能時代,技術創新的速度讓摩爾定律、新摩爾定律不斷被打破。
我們此前就討論過,隨著這兩年科技公司對算力和AI的史詩級投入,大模型底座技術漸成熟并由大廠開源后,AI界走向了更務實的道路——應用落地??駳g背后的冷思考:Open AI“網紅化”攪動AI圈
最新的權威數據統計:幾乎每六個中國人中,就有一人正在使用AI產品。
更有從業者直言,“最快5年之內,中國人一周只需要工作4天”。
我們做好準備來迎接這個新時代了嗎?
01
用AI造世界:文生圖、生視頻、生3D大模型加速開源
12月10日,OpenAI旗下視頻生成模型Sora,終于在首次亮相10個月后正式開放,新版工具Sora Turbo可以生成最長達20秒的視頻?;蛟S是由于等待的太久,用戶火熱的試用熱情一度讓OpenAI緊急關閉用戶注冊。
但是Sora姍姍來遲的這10個月的空檔期內,AI圈已經翻天覆地。
比Sora早一周,12月3日,有著“AI教母”之稱的李飛飛聯合創立并擔任CEO的AI公司World Labs官宣了首個成果——3D世界生成模型,可以讓用戶從單張圖片生成3D世界的AI系統,并且用戶可以與之互動。比如,通過鍵盤和鼠標在生成的3D場景里移動、轉換視角。
緊隨其后,12月4日,谷歌也發布了Genie 2,一個能把靜態照片變成可玩游戲的AI系統,同樣可以實現從靜態照片到可交互3D場景的轉換。
就在一個月前,著名游戲公司任天堂旗下寶可夢公司也宣布過一項類似的技術,用“大規模地理空間模型”,讓用戶距離空間智能更近了一步。簡單說,用戶可以自行上傳圖像,構建3D地圖,能精確而真實地看到放置到物理環境中的數字內容,而且這些內容是持久的,還能與他人共享。
??????????????????
大洋的另一端,中國AI技術同樣突飛猛進,在Sora跳檔的這10個月里加速趕超。
就在李飛飛官宣新技術的同一天,騰訊版Sora大模型面世,并免費開源!
12月3日,騰訊混元大模型官宣了最新的文生視頻大模型HunYuan-Video,用戶只需要輸入一段描述,即可生成視頻,該模型參數量達130億,是當前最大的視頻開源模型。從文本、到AI繪圖到3D生成再到視頻,騰訊混元大模型已經全系開源。
有參與測評的博主發布評論稱,其生成的視頻不僅語義理解精準,更是“最有電視劇質感的AI大模型”,甚至看不出一絲的AI味,對比以往文生視頻模式,即使面面占比很小的人臉都不會糊。
半個多月前,字節跳動視頻生成模型 PixelDance和Seaweed在即夢AI正式上線,并面向公眾免費開放使用,僅需60秒即能生成時長5秒的高質量AI視頻。
更早的半年之前,今年6月快手可靈文生視頻APP發布,至今已經經歷了十余次更新,包括發布圖生視頻功能以及1.5模型的上線等。
在文生圖領域,AI技術也在快速迭代。例如,12月2日,字節即夢AI上線了最新的圖片2.1模型,解決了AI圖像無法生成中文字體的問題,讓海報設計的效率再次大幅提升。
某種意義上,ChatGPT停止服務中國市場并不是壞事。
今年中國大模型廠家底層技術不斷降價并開源,帶動了更多中小創業者走上AI新牌桌。更重要的是,上述這些文生圖、文生視頻等以及文心一言、騰訊元寶、字節豆包、阿里千問等C端AI應用,在中國速度下都以免費的形式飛入了尋常百姓家。
QuestMobile數據顯示,2024年10月,AI原生應用行業月活躍用戶規模達到8976萬,同比增長373.0%。
02
AI+SaaS:智能體將是通往未來的新船票
視覺AI應用火,更火的是“智能體”。
圖片由AI創作
在AI改變虛擬和真實世界視覺聯系的同時,AI正在各式各類的SaaS應用中落地,各種形式的智能體已成為AI大模型落地的新載體,并且展現出強大的商業化前景。
所謂智能體,又叫AI Agent,是以AI大模型作為基礎,構建的可以進行交互、完成特定任務、或提供專業知識的智能系統或應用程序。
通俗說,智能體可以體現為,裝在傳統軟件App里的AI插件,也可以是一個獨立的AI APP。
相比較傳統的SaaS需要完全由人工來操作完成,智能體最大的特點是,接受互動對話指令,并直接產出結果,包括生成視頻、圖片、文章或完成一件工作。簡言之,所有的AI 應用都可以稱之為智能體。
OpenAI首席執行官Sam Altman曾提出,未來每個人都可以擁有一個智能體。
Salesforce首席執行官Marc Benioff更是直言,AI的未來發展不在于大語言模型,而在于開發AI自主代理,即智能體。
產品智能化已經是SaaS廠商在新時代下必須迎接的事實,在一些TO B場景內,許多傳統SaaS應用在AI加持下獲得了新的發展。
比如,做電商服務的有贊最新推出了“加我智能”功能,其智能體功能包括商機指引、智能托管、營銷專家、智能經營報告、智能穿搭、智能銷售等等。
正是有贊創始人白鴉預言,未來的生意,數字化是基礎,客戶運營是抓手,所有這些都可以交給智能技術完成。“我非常堅信,最多10年,最快5年之內,中國人一周只需要工作4天。用工具解決問題,數字化和智能化帶來效率提升是必然的趨勢?!?/p>
再比如,做教育的粉筆,最新升級了粉筆AI老師產品,這個智能體以對話形式存在,具備AI導練、學習規劃、考情咨詢、智能督學等在內的多項功能,可以幫用戶規范的作答思路,形成標準化作答習慣,并詳細解答答案,優化學習方向和可改進細節,主打一個專業、細心的教育陪伴。
互聯網大廠中,百度、阿里、騰訊、字節跳動、華為等皆已布局智能體賽道,并推出一站式智能體開發平臺,為開發者、創作者提供更為便捷的操作應用路徑。
美國著名孵化器YCombinator最新一期圓桌討論中提出觀點:垂直AI智能體的規??赡苁荢aaS的十倍。
美國一線AI從業者提到,AI大模型技術正在重塑軟件行業。如果說2004年在瀏覽器中可以增加XML HTTP請求這個功能,開啟了互聯網應用程序的新時代,帶來了整個SaaS軟件行業的20年繁榮;那么大型語言模型——LLM的出現,則是開啟了智能體時代的新篇章。
這一切正在發生。
QuestMobile最新報告提到,當下LLM的落地應用在網頁端、移動端都已比較成熟,正逐步拓展至智能硬件端,不斷深入用戶日常生活并提供更自然便捷的交互體驗。
市場研究機構 Research and Market在11月11日發布的報告中指出,未來五年AI智能體的市場規模將增加420億美元。
在騰訊研究院最新發布的《2025數字科技前沿應用趨勢》中指出,AaaS催化AI原生應用落地將是明年大趨勢之一。
AI的新時代已經勢不可擋。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.