網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

自由畫布，給創(chuàng)作者一個哆啦A夢的口袋

2025-01-24 15:07:52　來源: 遠川科技評論

上海舉報

分享至

當代職場人最煩兩件事，一是開會，二是線上開會。

我們常常把開會視作頭腦風暴、思維碰撞的絕佳場所，輔以office、pdf等線上文件處理工具，打破了空間限制，似乎又延伸了思維拓展的邊界。

但現(xiàn)實是，語言限制了思想表達的完整性，各類工具占滿了電腦內(nèi)存、燒干了CPU，不同文件用不同工具打開，滿滿當當?shù)碾娔X屏幕，讓人恨不得生出四雙眼睛。

大模型時代，職場人對AI創(chuàng)作寄予厚望，可chatbot上來一個“how can I help you today”對話框就讓語言的壁壘重現(xiàn)：該說什么才能讓chatbot盡快理解我的需求？

我們希望chatbot能代替自己的眼睛和大腦，以更高的效率消化各類素材，將頭腦風暴的范圍限制在chatbot的一個界面里，以更高的密度和更小的信息傳輸損害，實現(xiàn)更精準地輸出。

但“格式”成為了素材交融的最大屏障，降低了思維碰撞的效率和思維融合的范圍，產(chǎn)出的文章、PPT、海報，總不盡如人意。

AI創(chuàng)作要真正改變職場人和創(chuàng)作者的困境，核心不在于提供一個對甲方需求永遠耐心的“實習生”，而是一個打破語言、工具界限，思想碰撞更加高效無阻的思維宇宙和趁手可用的“小能手”。

從這一思路出發(fā)，2025年，一場AI創(chuàng)作的“撥亂反正”已經(jīng)開始了。

格式無界，創(chuàng)作無界

兩個月前，李彥宏在百度世界大會上親自推薦了一款產(chǎn)品——“自由畫布”，向AI創(chuàng)作的思維壁壘開了第一槍。

“自由畫布”主打多格式、全模態(tài)文件的理解、生成、創(chuàng)作能力，不管素材有多少種文件格式，“一圈一拖”即可實現(xiàn)一站式、多線程地素材的消化和結(jié)果的輸出。

“畫布”的概念由來已久，上次引發(fā)矚目是在2022年蘋果在iPad上引入“無邊記”?？偨Y(jié)其為何打動創(chuàng)作者，其實是尊重了創(chuàng)作的天馬行空，理解了靈感是迸發(fā)于不同素材之間的化學反應里的，為此作的努力是包容更多的素材，讓這種化學反應來得更猛烈一些。

百度文庫“自由畫布”在做的是類似的事。

創(chuàng)作的過程可以概述為“輸入->輸出”的過程，輸入素材的類型豐富程度、數(shù)量規(guī)模都極大程度地影響“輸出”的表現(xiàn)。但市面上的chatbot的普遍困境是，輸入端“要素”過多導致超載。

我們?nèi)粘?chuàng)作需要的素材格式有超過100種，視頻有mp4/avi/rmvb，文字資料有doc/epub/txt，圖片有jpg/gif/png，處理起來仿佛八國聯(lián)軍會晤，溝通需要翻譯，作戰(zhàn)風格需要磨合。

過去沒有大模型，我們也免不了在電腦上下載各類App，以避免“文件格式不支持”的窘境，chatbot不只是要支持不同格式的素材的呈現(xiàn)，還要能解讀、生成，難度更大了。

自由畫布依托于百度文庫和百度網(wǎng)盤的全面打通，覆蓋了我們?nèi)粘?chuàng)作中會用到的大部分素材格式，并且通過“一拖一圈”的極簡操作，輔以自然語言對話，打破了過往AI創(chuàng)作類產(chǎn)品的單一交互方式。

例如寫一篇《小巷人家》的劇評，需要的素材包括電視劇片段、劇照、劇情梗概、社交平臺評論，延伸一些還包括主創(chuàng)幕后采訪（文字/視頻）等，創(chuàng)作者可以在將它們?nèi)客系揭粔K“畫布”上，或者直接從百度網(wǎng)盤一鍵上傳。

每個素材都可以進行針對性解析，根據(jù)素材的內(nèi)容，可以通過「一圈」的方式，分門別類地選擇參考邏輯結(jié)構(gòu)、語言風格、主要觀點等等，實現(xiàn)靈感的激發(fā)和個性化內(nèi)容的創(chuàng)作。

創(chuàng)作者在此基礎上進行進一步篩選后，用鼠標圈定出可用的素材，點擊“生成文檔”，確認大綱后即可生成文檔，生成的文檔中會理解素材，并直接在合適的位置插入素材。

初稿不僅可修改（自由畫布不僅內(nèi)置編輯器，還能用AI對選定段落進行改寫、擴寫、寫作風格的更改等等），還可以作為素材與其他素材再次“化學反應”，循環(huán)“一拖一圈”的步驟迭代到第二版、第三版。

自由畫布的靈魂是“自由”，旨在提供一個不受限于格式的素材池，為創(chuàng)作者開辟一個無拘無束、充分拓展的思維空間，再輔以實用性更強的“AI小能手”，是思維空間，更是創(chuàng)作空間。

哆啦A夢的口袋

歐洲的民俗傳說中有一雙著名的“七里靴”，《浮士德》里的惡魔穿著它追趕浮士德“一步七里”。

創(chuàng)作者對AI創(chuàng)作的實際訴求類似于“七里靴”，本質(zhì)是讓創(chuàng)作的每一個步驟都擁有更高的效率、范圍更大的延伸，而不是讓chatbot代替自己去創(chuàng)作，讓“七里靴”代替自己去跑。

傳統(tǒng)的chatbot限定了創(chuàng)作者以對話的形式“告訴”chatbot自己的需求，實際上是放棄了一部分“只可意會不可言傳”的信息，造成產(chǎn)出與需求的錯位，所以創(chuàng)作者普遍有這樣的困惑，“明明該說的都說了，為什么chatbot寫的文章還是不符合我的要求？”

自由畫布在流程和功能設計上的“撥亂反正”由此入手，一個個功能明確的按鈕取代了逼迫人咬文嚼字的對話框，就像windows自帶的畫圖軟件，看著死板卻“開箱即用”。

功能設計則將重點放在提高重復性強、依賴算力的環(huán)節(jié)的效率以及素材的延伸和拓展，在這個過程中，各個“輸出”關鍵節(jié)點的“確定權”仍在創(chuàng)作者手中，打造了一個流程可控、多任務并行、公私域內(nèi)容全面打通的高效創(chuàng)作空間。

假設要做一個有關“中國電動車技術發(fā)展現(xiàn)狀”的ppt，可以上傳一個內(nèi)容弱相關、但布局風格可以借鑒的ppt，僅選擇“使用當前模板”，內(nèi)容方面，則可以上傳機構(gòu)報告、行業(yè)分析等，參考其中主要觀點或文字風格。

相當于在“輸入端”劃了重點，輸出就會更精準、更符合需求，事半功倍。

在圈定好各個素材的參考側(cè)重點后，生成具體文章前還會給出文章大綱，給了創(chuàng)作者修改文章思路的機會，不滿意則重新生成或者添加新的素材。

多任務并行則是自由畫布區(qū)別于主流AI創(chuàng)作應用在效率上的獨有的優(yōu)勢。

目前市面上大部分chatbot采用的是串行模式，即同一時間只執(zhí)行一個操作，就像開篇描述的“干瞪進度條”，是工作效率的洼地——人類工作還能一邊開電話會議一邊寫材料呢。

自由畫布可以一邊做視頻素材的內(nèi)容總結(jié)，一邊做文字素材的觀點提取，這種并行操作更符合打工人“一邊做渲染一邊剪片子”的日常，工作效率提升了幾個層級。

百度文庫、百度網(wǎng)盤的公私域全面打通，配合AI全網(wǎng)搜，則是給自由畫布“開了掛”。

比如做“中國電動車技術發(fā)展現(xiàn)狀”ppt，可以從網(wǎng)盤、文庫一鍵上傳相關公司的財報、發(fā)展歷程和行業(yè)報告；已有的素材里行業(yè)數(shù)據(jù)太老需要更新，直接點擊下方的“AI全網(wǎng)搜”按鈕、搜索到最新數(shù)據(jù)后點擊確認，再做類似的“劃重點”操作。

自由畫布集成了全新的智能生產(chǎn)力，充分賦能創(chuàng)作者，就像哆啦A夢的口袋之所以成為童年夢想，不是因為提供了唾手可得的成果，而是讓我們變成了更強大的人。

AI創(chuàng)作重定義

人工智能早在2012年就成為顯學，但直到大模型給人工智能帶來了“生成式”的前綴，才開始在產(chǎn)業(yè)引發(fā)海嘯?！吧伞奔词巧a(chǎn)力的顯化，結(jié)合當代生產(chǎn)力的組成，以“生成文稿”、“生成繪畫”為代表的AI創(chuàng)作，便成為了大模型公司最早發(fā)力的領域。

但直到現(xiàn)在，真正在職場上發(fā)揮作用的AI創(chuàng)作產(chǎn)品屈指可數(shù)。

2024年高喊著“大模型落地元年”的口號到來，但AI創(chuàng)作卻似乎進入了冷靜期，無論是大模型公司還是創(chuàng)作者，都開始審視大模型的輸出是否與創(chuàng)作者的真實需求對齊。

總結(jié)了主流產(chǎn)品的推廣困境，自由畫布主要聚焦于兩個思路做突破：一是交互上的全面革新，二是充分理解“AI+創(chuàng)作”，不僅真正實現(xiàn)了all in one的一站式滿足，還帶來全新的解法。

交互的問題主要來自于ChatGPT爆火帶來的先入為主。

在一些特定場景中，“對話”確實是更好的交互方式，比如手機AI管家、智能家居等，共同點是需要處理的都是標準化的事務性工作，比如打車、訂餐廳座位、空調(diào)自動調(diào)節(jié)等，也就是說評判標準是“最沒做到”，而不是“好不好”。

AI創(chuàng)作與這些工作的核心區(qū)別在于，其輸入和輸出都是風格化、個性化的，充滿了主觀的、難以用語言概括的輸入和評判標準，因此要做的是把創(chuàng)作的主導權還給創(chuàng)作，大模型的角色不是「助手」，而是一個幫助創(chuàng)作者提高效率的「能手」。

由此誕生的自由畫布，充分給予用戶交互上的自由，從目前的反饋來看，其有別于其他AI創(chuàng)作產(chǎn)品的在線編輯器、多格式支持、多線程并行、讓用戶普遍感覺“比想象的好用”。

而百度有意的“功能留白”，也給自由畫布更加完善的未來留下了想象空間。

比如自由畫布基于網(wǎng)盤、文庫底層打通、格式打通，如果生成的作品可以通過鏈接分享給他人，有望開拓一個“共同創(chuàng)作”的空間，即同一作品可以由多人完成、多層級修改、多線程處理，很適配于文化創(chuàng)意產(chǎn)業(yè)的協(xié)同模式，也開辟出了全新的AI創(chuàng)作場景。

2024年結(jié)束了，有遺憾也有沉淀，自由畫布的登場，已經(jīng)給2025年AI創(chuàng)作的新敘事鋪墊了一個好的開頭。

參考資料

[1]Computing inside an AI, Will Whitney

[2]為什么聊天機器人界面不是未來，無界社區(qū)mixlab

[3]AI產(chǎn)品形態(tài)交匯的背后：Canvas, Artifacts, Cursor and more，左右橫眺

作者：何律衡

編輯：李墨天

視覺設計：疏睿

責任編輯：何律衡

封面圖片來自ShotDeck

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.