對AI而言,能「完整交付」才是硬道理。
文 | 佘宗明
在當下,「AI取代不了人,但不用AI的人將被會用AI的人取代」一語風行。但就提高大眾AI素養問題看,與其奚落不會用好AI的人,不如讓AI變得更好用。
技術專家賈斯汀·威斯科特就說:目前大多數LLM(大語言模型)就像有無限工具的瑞士軍刀——令人興奮卻也讓人不知所措。但用戶其實不想搞清楚AI,他們想要的是解決方案。
在他看來,如果AI要取代應用程序(APP),它必須變得隱形,無縫集成到日常工作流程中,而不需要用戶記憶功能入口、設置格式參數。
言下之意,AI產品理應「把復雜留給技術,把簡單留給用戶」。
我對此的理解是,如果將AI比作賽博大廚,那時下很多AI產品就是止于給用戶「遞食材(圖文信息)」,可用戶想要的,是能直接端上一桌「大餐(如工作報告、行業研報等)」。
該怎么讓AI端上一桌「大餐」?
百度文庫、網盤給出的全新解法是:拍一下。
打開百度網盤APP里新上線的「AI相機」,對著「菜單」拍一下(輸入),它非但能識別「菜品」、推薦「菜譜」(處理),還能生成包含采購清單、烹飪步驟、擺盤設計等在內的「菜譜包」(交付)。
▲用戶點擊百度網盤App上方相機入口進入后,即可體驗新上線的「AI相機」功能。
一通操作下來,你會發現,AI相機已不光是拍照工具,更是開啟全模態智能世界的入口。它連著的,是百度文庫、網盤在行業內率先構建起的全模態輸入、處理、輸出的系統化完整交付能力。
而完整交付能力,正是AI越過從「能用」到「好用」那條金線的關鍵所在。
01
盡管桌面上的 AI 產品圖標數量已突破個位數,但 不得不說,「創作鏈條割裂化」和「交付結果半成品化」仍是很多用戶在內容創作與消費、信息生產與獲取過程中的共同痛點。
《新周刊》此前報道中提到的「為制作一份30頁的行業報告,需要先讓ChatGPT生成框架,再調用Claude優化表述,最后還得用Grammarly檢查語法——整個過程下來反而比傳統方式更耗時」情形,絕非孤例。
這道出了時下許多AI工具的硬傷:雖然AI產品百花齊放,但受制于多模態輸入需求與工具單一處理能力的矛盾、公私域數據資源整合的瓶頸,很多AI產品缺乏「意圖理解-內容生成-多形態交付」的連貫性,且只能提供基礎性素材。
隨之而來的,是用戶找資料時得在文檔工具、網盤、專業數據庫里來回找,設計時要在PS、PR、AI、AE工具中頻繁切換,經常還得手動拼接那些圖文并茂的文章、有專業圖表的PPT、帶聲音的視頻等。
▲《新周刊》的文章截圖。
這就對AI產品提出了交互門檻降低、處理復雜任務能力提升兩點要求。在這兩點上,百度文庫和百度網盤作為目前能力最全面、交付最完整的AI產品,就扮演了積極的探索者角色。
在大模型重構下,前者已成為「一站式AI內容獲取和創作平臺」,后者也升級為了「一站式內容服務平臺」。
二者進行全面融合和能力共建,打通從「創編存管」到「找看用享」全流程環節后,更是實現了能力厚度與廣度的拓展,讓AI在用戶所需之時「無所不能」、所需之處「無處不在」。這標志著,百度在多模態AI領域拓展了從底層積累到場景拓殖的閉環深度。
如此一來,用戶從發起需求到拿到成品幾乎可以全程無憂,能在一站式需求滿足中感受到AI帶來的高效便捷。
02
說到完整交付,首先其實是要滿足用戶的多種模態文件的輸入需求。
而全模態的輸入能力,在AI相機中就得到了充分的體現。
試想這番景象:部門開完會后,以往為怎么捋出雜亂板筆記中的要點的你,用相機對著白板一拍,之后就有「人」自動干活,如文字識別、手寫涂鴉轉譯、重點標注、生成待辦清單,還做成PPT,躺在了你的網盤文件夾里,你可隨時分享給同事。
聽起來,是不是很夢幻?但就是百度AI相機施展的「魔法」。
跟傳統相機聚焦于拍攝有別,百度正重構很多人對「相機」的認知:它打造了打造「存、管、用、創、享」一體化入口,用戶拍下的照片不僅能一鍵存儲、智能分類,還能直接觸發修圖、文字提取、翻譯、掃描、創作等全鏈路操作。
▲用戶可拍攝照片或從網盤/手機本地相冊導入照片,并通過「AI相機」使用修圖美顏、拍照識別、解題、文字提取、翻譯、掃描、合同檢查等一系列AI功能。
也許聽著它的那些核心優勢——即拍即存+直存云端、全場景智能處理、一站式修圖處理、長期管理與回憶功能等,用戶可能只有粗線條感知。
可如果知道它能消除內存焦慮,能在學習場景自動解題、工作場景智能掃描轉化、生活場景萬物識別推薦,能輕易進行人像修圖、線稿提取、繪畫風格轉換、去水印等操作,能實現智能化識圖、轉文檔、拍照解題等功能,許多人想必會有所觸動。
若是知道它還能自動按地點、人物、事物、類型等多維度對照片進行分類還能智能搜圖,能采用影像精選策略、大模型生成文案并一鍵導出分享到社交媒體,很多人興趣還會更濃。
當學生拍照后,AI會生成解題思路、錯題歸檔、舉一反三出題;當職場人士掃描合同后,系統自動檢查風險條款、生成修改建議……AI相機變成圖像內容一站式服務、全模態超級入口的價值,也會來得真切可感。
AI相機補全全模態輸入的「圖片輸入缺口」,本質上也是為深度完整交付能力做加法。
03
得看到,「從食材到宴席」的深度完整交付能力,背靠的是百度獨有的技術組合拳:文庫公域+網盤私域的雙數據庫,相當于豐富食材庫;全球首個內容操作系統滄舟OS的調度中樞系統,就像是宴席總廚;百余項 AI Agent,可看成各菜系廚師。
從完整交付內含的「輸入-處理-輸出」三個流程看,打造「全模態需求接收→多Agent 智能調度→端到端完整交付」的閉環不可或缺。
就多模態輸入來說,學生黨能否在學習場景中拍題向AI求解,職場人士能否通過上傳圖片將紙質文件轉換成電子文檔進行智能編輯……也就是能不能讓用戶以最自然最便捷方式表達需求,很考驗AI產品技術能力。
不少AI產品在捕捉用戶需求時,文是文、圖是圖、語音是語音、視頻是視頻,就算有多模態,也無法完全接收轉換。
但百度文庫網盤能夠全天候和全方位地接受并響應需求,啟動任務。無論用戶處于何種場景(如學習、辦公、生活娛樂等)、在哪個地區、使用何種設備(如手機、電腦、平板等),都可以通過鍵盤、AI相機、AI視頻、AI麥克風等多種輸入方式,向系統輸入需求。
就多模態處理而言,以往需要用戶一次次「點擊確認下一步」的任務,現在能否自動調用OCR識別、語義消歧、邏輯推理等子模塊,形成自適應服務鏈,很重要。
而以「文庫公域專業資料庫、網盤私域數據庫、用戶記憶庫(三庫)+百度學術平臺(一平臺)+閱讀器、編輯器、播放器(三器)」為依托的滄舟OS,不光是高度智能的需求識別與任務分發中樞,能將一句話一個詳盡的To Do List(待辦事項清單),還能開啟賈維斯的能動模式。
▲全模態處理是實現完整交付的關鍵環節,其核心支撐則是作為技術底座的滄舟OS。
百度副總裁,文庫事業部、網盤事業部負責人王穎就曾說過,滄舟OS跟其他操作系統的區別是,其他操作系統主要的是提供「大腦」,上面那些應用程序是「四肢」,滄舟OS則是既有大腦(智能決策中樞)也有四肢(完整工具鏈)的「超能人」。
再就多模態輸出來看,考慮到用戶實際需要,是否具備全模態交付成功的能力很重要。
跟傳統AI產品提供的多為「半成品」不同,百度文庫網盤可直接奉上「成果包」——包括應用戶之需輸出的PPT+文案+圖表+音視頻的全模態、全格式內容。
04
當AI開始學會「理解需求全貌、規劃任務鏈條、整合資源交付」,它就不再是工具鏈的一環,而是成為了能替人解決復雜問題的智能搭檔——這或許才是AI該有的樣子。
說到底,人們使用AI,要的不是使用本身,而是解決問題。解決問題的應有之義就是完整交付。
百度文庫網盤就在將多年來的技術積累,轉化為面向用戶真實需求的完整解決方案。無論是用AI相機的「一拍即存即處理」來為全模態輸入不缺,還是用百度文庫先前推出的GenFlow超能搭子的「多模態內容一站式生成」來最大化地滿足用戶之需,都裹著濃厚的「交付導向」色彩。
▲百度文庫、網盤構建起了全模態輸入、處理、輸出的系統化完整交付能力。
到頭來,百度文庫網盤蓄積了在內容創作、內容消費、個人知識庫等方面行業領先的AI賦能能力,也引領著大模型行業從深度思考走向深度交付的新趨勢。
數據會說明很多事情:百度文庫曾數次登上AIGC應用榜單「AI產品榜」榜首,AI月活用戶達9700萬,網盤AI月活超8000萬,6月初位列AI產品榜國內總榜第一、全球總榜第二(僅次于ChatGPT),就是用戶對其系統化完整交付能力的認可。
而迎來新增長曲線,也成了百度文庫網盤形成覆蓋創作、管理、消費的全生命周期服務能力,繼而在內容創作效率與交付質量上實現代際領先激起的市場回響。
一方面,由于解決了用戶時間成本與精力損耗上的痛點,讓AI切實變成生產力工具,兩大產品的用戶粘性與付費意愿得以提升;另一方面,用戶從文庫獲取知識,在網盤存儲管理,再通過AI相機與GenFlow創作新內容,也能涵養可持續、更繁榮的內容生態,強化百度在AI信息內容領域的競爭壁壘。
可以預見的是,當文庫網盤以深度完整交付兌現「把復雜留給技術,把簡單交給用戶」的潛在承諾時,這會無形中強化「用AI,來文庫網盤就夠了」的用戶心智,也會為國民級應用樹立AI時代的新價值標桿。
?作者 | 佘宗明
?運營 | 李玩
轉載須經許可
廣告合作請聯系微信號:rabgogo88
或手機號:18810070968
敬請關注
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.