當代職場人最煩兩件事,一是開會,二是線上開會。
我們常常把開會視作頭腦風暴、思維碰撞的絕佳場所,輔以office、pdf等線上文件處理工具,打破了空間限制,似乎又延伸了思維拓展的邊界。
但現實是,語言限制了思想表達的完整性,各類工具占滿了電腦內存、燒干了CPU,不同文件用不同工具打開,滿滿當當的電腦屏幕,讓人恨不得生出四雙眼睛。
大模型時代,職場人對AI創作寄予厚望,可chatbot上來一個“how can I help you today”對話框就讓語言的壁壘重現:該說什么才能讓chatbot盡快理解我的需求?
我們希望chatbot能代替自己的眼睛和大腦,以更高的效率消化各類素材,將頭腦風暴的范圍限制在chatbot的一個界面里,以更高的密度和更小的信息傳輸損害,實現更精準地輸出。
但“格式”成為了素材交融的最大屏障,降低了思維碰撞的效率和思維融合的范圍,產出的文章、PPT、海報,總不盡如人意。
AI創作要真正改變職場人和創作者的困境,核心不在于提供一個對甲方需求永遠耐心的“實習生”,而是一個打破語言、工具界限,思想碰撞更加高效無阻的思維宇宙和趁手可用的“小能手”。
從這一思路出發,2025年,一場AI創作的“撥亂反正”已經開始了。
格式無界,創作無界
兩個月前,李彥宏在百度世界大會上親自推薦了一款產品——“自由畫布”,向AI創作的思維壁壘開了第一槍。
“自由畫布”主打多格式、全模態文件的理解、生成、創作能力,不管素材有多少種文件格式,“一圈一拖”即可實現一站式、多線程地素材的消化和結果的輸出。
“畫布”的概念由來已久,上次引發矚目是在2022年蘋果在iPad上引入“無邊記”。總結其為何打動創作者,其實是尊重了創作的天馬行空,理解了靈感是迸發于不同素材之間的化學反應里的,為此作的努力是包容更多的素材,讓這種化學反應來得更猛烈一些。
百度文庫“自由畫布”在做的是類似的事。
創作的過程可以概述為“輸入->輸出”的過程,輸入素材的類型豐富程度、數量規模都極大程度地影響“輸出”的表現。但市面上的chatbot的普遍困境是,輸入端“要素”過多導致超載。
我們日常創作需要的素材格式有超過100種,視頻有mp4/avi/rmvb,文字資料有doc/epub/txt,圖片有jpg/gif/png,處理起來仿佛八國聯軍會晤,溝通需要翻譯,作戰風格需要磨合。
過去沒有大模型,我們也免不了在電腦上下載各類App,以避免“文件格式不支持”的窘境,chatbot不只是要支持不同格式的素材的呈現,還要能解讀、生成,難度更大了。
自由畫布依托于百度文庫和百度網盤的全面打通,覆蓋了我們日常創作中會用到的大部分素材格式,并且通過“一拖一圈”的極簡操作,輔以自然語言對話,打破了過往AI創作類產品的單一交互方式。
例如寫一篇《小巷人家》的劇評,需要的素材包括電視劇片段、劇照、劇情梗概、社交平臺評論,延伸一些還包括主創幕后采訪(文字/視頻)等,創作者可以在將它們全部拖到一塊“畫布”上,或者直接從百度網盤一鍵上傳。
每個素材都可以進行針對性解析,根據素材的內容,可以通過「一圈」的方式,分門別類地選擇參考邏輯結構、語言風格、主要觀點等等,實現靈感的激發和個性化內容的創作。
創作者在此基礎上進行進一步篩選后,用鼠標圈定出可用的素材,點擊“生成文檔”,確認大綱后即可生成文檔,生成的文檔中會理解素材,并直接在合適的位置插入素材。
初稿不僅可修改(自由畫布不僅內置編輯器,還能用AI對選定段落進行改寫、擴寫、寫作風格的更改等等),還可以作為素材與其他素材再次“化學反應”,循環“一拖一圈”的步驟迭代到第二版、第三版。
自由畫布的靈魂是“自由”,旨在提供一個不受限于格式的素材池,為創作者開辟一個無拘無束、充分拓展的思維空間,再輔以實用性更強的“AI小能手”,是思維空間,更是創作空間。
哆啦A夢的口袋
歐洲的民俗傳說中有一雙著名的“七里靴”,《浮士德》里的惡魔穿著它追趕浮士德“一步七里”。
創作者對AI創作的實際訴求類似于“七里靴”,本質是讓創作的每一個步驟都擁有更高的效率、范圍更大的延伸,而不是讓chatbot代替自己去創作,讓“七里靴”代替自己去跑。
傳統的chatbot限定了創作者以對話的形式“告訴”chatbot自己的需求,實際上是放棄了一部分“只可意會不可言傳”的信息,造成產出與需求的錯位,所以創作者普遍有這樣的困惑,“明明該說的都說了,為什么chatbot寫的文章還是不符合我的要求?”
自由畫布在流程和功能設計上的“撥亂反正”由此入手,一個個功能明確的按鈕取代了逼迫人咬文嚼字的對話框,就像windows自帶的畫圖軟件,看著死板卻“開箱即用”。
功能設計則將重點放在提高重復性強、依賴算力的環節的效率以及素材的延伸和拓展,在這個過程中,各個“輸出”關鍵節點的“確定權”仍在創作者手中,打造了一個流程可控、多任務并行、公私域內容全面打通的高效創作空間。
假設要做一個有關“中國電動車技術發展現狀”的ppt,可以上傳一個內容弱相關、但布局風格可以借鑒的ppt,僅選擇“使用當前模板”,內容方面,則可以上傳機構報告、行業分析等,參考其中主要觀點或文字風格。
相當于在“輸入端”劃了重點,輸出就會更精準、更符合需求,事半功倍。
在圈定好各個素材的參考側重點后,生成具體文章前還會給出文章大綱,給了創作者修改文章思路的機會,不滿意則重新生成或者添加新的素材。
多任務并行則是自由畫布區別于主流AI創作應用在效率上的獨有的優勢。
目前市面上大部分chatbot采用的是串行模式,即同一時間只執行一個操作,就像開篇描述的“干瞪進度條”,是工作效率的洼地——人類工作還能一邊開電話會議一邊寫材料呢。
自由畫布可以一邊做視頻素材的內容總結,一邊做文字素材的觀點提取,這種并行操作更符合打工人“一邊做渲染一邊剪片子”的日常,工作效率提升了幾個層級。
百度文庫、百度網盤的公私域全面打通,配合AI全網搜,則是給自由畫布“開了掛”。
比如做“中國電動車技術發展現狀”ppt,可以從網盤、文庫一鍵上傳相關公司的財報、發展歷程和行業報告;已有的素材里行業數據太老需要更新,直接點擊下方的“AI全網搜”按鈕、搜索到最新數據后點擊確認,再做類似的“劃重點”操作。
自由畫布集成了全新的智能生產力,充分賦能創作者,就像哆啦A夢的口袋之所以成為童年夢想,不是因為提供了唾手可得的成果,而是讓我們變成了更強大的人。
AI創作重定義
人工智能早在2012年就成為顯學,但直到大模型給人工智能帶來了“生成式”的前綴,才開始在產業引發海嘯。“生成”即是生產力的顯化,結合當代生產力的組成,以“生成文稿”、“生成繪畫”為代表的AI創作,便成為了大模型公司最早發力的領域。
但直到現在,真正在職場上發揮作用的AI創作產品屈指可數。
2024年高喊著“大模型落地元年”的口號到來,但AI創作卻似乎進入了冷靜期,無論是大模型公司還是創作者,都開始審視大模型的輸出是否與創作者的真實需求對齊。
總結了主流產品的推廣困境,自由畫布主要聚焦于兩個思路做突破:一是交互上的全面革新,二是充分理解“AI+創作”,不僅真正實現了all in one的一站式滿足,還帶來全新的解法。
交互的問題主要來自于ChatGPT爆火帶來的先入為主。
在一些特定場景中,“對話”確實是更好的交互方式,比如手機AI管家、智能家居等,共同點是需要處理的都是標準化的事務性工作,比如打車、訂餐廳座位、空調自動調節等,也就是說評判標準是“最沒做到”,而不是“好不好”。
AI創作與這些工作的核心區別在于,其輸入和輸出都是風格化、個性化的,充滿了主觀的、難以用語言概括的輸入和評判標準,因此要做的是把創作的主導權還給創作,大模型的角色不是「助手」,而是一個幫助創作者提高效率的「能手」。
由此誕生的自由畫布,充分給予用戶交互上的自由,從目前的反饋來看,其有別于其他AI創作產品的在線編輯器、多格式支持、多線程并行、讓用戶普遍感覺“比想象的好用”。
而百度有意的“功能留白”,也給自由畫布更加完善的未來留下了想象空間。
比如自由畫布基于網盤、文庫底層打通、格式打通,如果生成的作品可以通過鏈接分享給他人,有望開拓一個“共同創作”的空間,即同一作品可以由多人完成、多層級修改、多線程處理,很適配于文化創意產業的協同模式,也開辟出了全新的AI創作場景。
2024年結束了,有遺憾也有沉淀,自由畫布的登場,已經給2025年AI創作的新敘事鋪墊了一個好的開頭。
參考資料
[1]Computing inside an AI, Will Whitney
[2]為什么聊天機器人界面不是未來,無界社區mixlab
[3]AI產品形態交匯的背后:Canvas, Artifacts, Cursor and more,左右橫眺
作者:何律衡
編輯:李墨天
視覺設計:疏睿
責任編輯:何律衡
封面圖片來自ShotDeck
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.