?商業與生活 文|朱曉培
校對|大道格
“ChatGPT這么會聊天,還要朋友干什么?”
“ChatGPT要毀滅全人類了?!?/p>
“OpenAI一夜改寫歷史,ChatGPT-4o干翻所有語音助手?!?/p>
5月14日,OpenAI舉行春季發布會后,國內的科技媒體瞬間變成了“UC震驚總部”,紛紛鼓吹起了ChatGPT-4o的“顛覆力”。
然而,它并沒有媒體們鼓吹得那么邪乎。
01
“呆瓜”變終極版“貓精”
如果說,之前的通用大模型,是只能讀文看圖、說廢話的“呆瓜”,新發布的GPT-4o已經更加的自然、智能。原天貓精靈創始高管杜海濤稱ChatGPT-4o是終極形態的“天精(天貓精靈)”?!爸皇俏覀冎笆荵Y(想象智能音箱的終極形態),但人家實現了,確實厲害。”
在發布會現場,當OpenAI 的工程師Mark Chen對GPT-4o說:“我第一次來直播的發布會,有點緊張?!盙PT-4o回答說:“要不你深呼吸一下”
Mark Chen故意做出夸張的呼吸動作時,GPT-4o能夠識別出來,并響應說:“你這不行,喘得也太大了?!?/p>
當另一位工程師用前置鏡頭自拍后,GPT-4o識別出了他的情緒,“看起來很開心,甚至可以說是興奮的”,還從他背后的畫面判斷其身處的環境,“看起來你在一個攝影棚中,背后有一些燈光,你的胸前還別著麥克風,可能在錄制視頻之類的”。
在這個演示過程中,我們可以看到,不論是用語音還是視頻圖像,GPT-4o與人的“人機對話”變得更為自然、流暢。人們可以隨時中斷對話,進入到下一個話題,GPT-4o能夠及時識別并做出反應。而且,它還可以識別出人的情緒。OpenAI的CEO山姆·奧特曼(Sam Altman)將之稱為“人類級別的響應”。
此外,在解答數學方式,測試代碼等功能上,GPT-4o除了可以準確、快速地獲得答案的同時,還可以講解其中的原理和目的。
總之,GPT-4o看起來更像“人”了。這看起來是一個極大的進步。發布會之后,奧特曼在X上也發布了一個推文——Her。
《Her》是2013年上映的一部科幻片,講述作家西奧多失戀后,愛上了電腦操作系統里的女聲——薩曼莎。薩曼莎性感幽默、善解人意,但其實是一個以某哲學家為原型建造的OS系統,“她”總共有8316位人類交互對象,并與其中的641位發生了愛情,西奧多只是其中的一位。
從現場的演示來看,OpenAI現在發布的ChatGPT-4o確實很接近“Her”了。但它本質上,仍然是一個“聊天機器人”。它所演示的一些功能,其實在現有的移動互聯網上都可以找到相應的原型,比如講解數學題,是作業幫這樣的教育APP上都有的功能,只是GPT-4o表現形式更加自然。
但是,認為它“顛覆人類”,實在是國內媒體的大驚小怪。金沙江創業投資基金主管合伙人朱嘯虎認為,GPT-4o的發布,恰恰是大模型的技術迭代曲線放緩的表現。而且,此次,OpenAI宣布推出桌面版并免費,說明GPT的用戶和收入增長都已經碰到瓶頸。
02
GPT-4o真正的大招是免費
一個有趣的現象,不論是之前GPT的出現,還是“文生視頻”大模型Sora的發布,朋友圈里的AI從業者和創業者們都紛紛感慨技術的進步,鼓吹AI的創新能力。然而,這一次,GPT-4o發布后,創業者們表態得很少。朱嘯虎的朋友圈甚至帶了些唱衰的意思。
前后反差為何這么大?《商業與生活》認為,有兩個原因。
第一,GPT-4o的人機交互能力固然又向前邁進了一步,但并沒有像許多科技媒體鼓吹的那么“顛覆”。
GPT-4o的底層算法還是GPT-4,本質上仍是一個對話大模型,是將文字對話變成語音,中間加上了一部分聯想,相當于把Sora對于自然語言的處理算法結合進來了。但是,這部分算法的結合,在使用過程中,仍然會有很高的錯誤率。
第二,GPT-4o宣布免費了,這對于任何一個大模型創業者,任何一家大模型創業公司來說,都算不上一個好消息。
GPT-4o開放了不注冊也可使用的限制,目前用戶可以選擇免費限次數使用,或者付費不限次數地使用。OPenAI選擇卷入免費模式的競爭,說明GPT的用戶和收入增長都已經碰到瓶頸,但也會讓其他大模型創業公司的生存環境變得更加艱難。
就在幾天前,李開復還針對國內大模型賽道的“大亂斗”,呼吁創業者關注TC-PMF(Technology-Cost Product-Market-Fit,技術成本X產品市場契合度),拒絕ofo式燒錢打法,讓大模型能夠用健康良性的ROI(投資回報率)蓄能長跑。
然而,盡管所有的從業者都知道“ofo式燒錢”的打法不可持續,但是卻沒有人敢主動退出“燒錢”的行列?,F在有一堆人涌進來做大模型,但客戶不愿意付費,因為客戶是非常理性。在技術水平差不多的情況下,肯定是哪家便宜就用哪家,哪家免費就用哪家。你收費,就不選你。
而現在,GPT-4o,這個技術明顯比國內大模型更先進的大模型都選擇免費了,其他做通用大模型的公司,就更沒法向用戶收費了。
實際上,大模型賽道的“大亂斗”不僅局限在創業公司之間,也已經卷到了云服務商。就在5月15日,火山引擎原動力大會上,字節發布跳動豆包大模型,定價只有0.0008元/千Tokens,推動大模型價格步入了“厘時代”。
03
“AI顛覆論”可以休矣
就在OpenAI春季發布會第二日,谷歌在新一屆I/O開發者大會上,連續發布、更新了十多款產品,包括AI助手Astra、文生圖模型Imagen3、對標Sora的文生視頻模型Veo,以及備受矚目的旗艦大模型Gemini。
其中,Gemini的新語音對話功能Live,直接對標OpenAI的GPT-4o,同樣可通過語音、視頻實時詢問周圍的情況,可以中斷對話再及時跟進。
一個月前,Meta推出了大語言模型Llama 3,在對話理解、推理、圖像生成等方面并沒有明顯的短板,生成體驗平滑。Meta CEO 扎克伯格稱其為,“迄今能力最強的開源大模型”。
大模型的更新,確實會改變一些應用層的體驗。杜海濤就認為,隨著大模型技術的進化,酒店機器人,新能源汽車,滴滴,高德,美團,淘寶,支付寶等大量與現實生活鏈接服務和內容型服務的體驗更加智能。
大模型也可能會改變一些行業的格局,比如搜索格局,以前,人們想知道一件事怎么做,不會打開搜索引擎,或者打開某個APP再去搜索,但有了大模型,人們可以直接在手機、電腦上打開桌面版的大模型,與大模型直接對話。
然而,大模型的應用依舊是一個漫長的進程,特別是ToB的大規模的使用,是一個謹慎的過程,容不得一點兒差錯。此前,某位創業者,也是大模型的B端用戶就對《商業與生活》表示,“大模型現在還達不到那個效果,還需要很長一段時間的訓練,才可以達到可用的臨界點?!?/strong>
年初Sora發布時,國內媒體一些媒體也用了“顛覆視頻行業”,“Sora干翻抖音”。來形容它,然而3個月過去,實際使用效果平平,當初OPenAI發布的短片《氣球人(Air Head)》。 近日其制作團隊Shy Kids揭露,這部短片,是三人耗費近兩周才完成,后期(人的)工作量只增不減。
可以說,這兩天國內一些媒體對GPT-4o的吹捧,實在是一種“驚詫論”。他們似乎有一種習慣,過度夸大硅谷成果,特別是OPenAI的成果。但同時,又國內科技公司的進展“格外克制”。
不論是Llama 3,GPT-4o,還是Gemini,在功能上大同小異。而國內近期發布的大模型,比如阿里通義2.5,官方宣傳已經全面趕超 GPT-4。不過,那些宣揚“GPT-4o顛覆論”的媒體們,面對通義2.5時,又變得十分冷靜了。
AI確實會改變人類的工作方式,比如顯著提高程序員的工作效率,推進科學、醫療保健和各種領域的進步,最終會影響產品和經濟的方方面面。但AI的出現,本意是創造一個AI個人助手,幫助用戶處理復雜的任務以及采取行動,而不是試圖取代或者顛覆人類。
那些刻意制造“AI焦慮”的言論,可以休矣。
—End—
更多關注:商業與生活,ID:xiaopeizhu8
內容同步:網易號、同花順、百家號、今日頭條、UC、雪球、企鵝號、一點資訊、知乎、搜狐等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.