文:王智遠 | ID:Z201440
我覺得:
百度、阿里、騰訊、頭條大公司推出模型中,阿里這個 Chatbot頁面設計得足夠簡潔,可以說,最像 ChatGPT的。地址是:https://chat.qwen.ai
電腦端、手機端,界面都干凈直觀,效果一致;這種設計不是路徑依賴,而是「外形依賴」;模仿 ChatGPT極簡風格,讓用戶覺得特別方便:想用就直接上手,不用折騰。
整體來看,這個平臺似乎整合了阿里所有模型的能力。
我查了一下最新數據,Qwen系列的衍生模型數量已經突破 9 萬個,成為全球開源模型數量的第一名,甚至超過Meta的Llama 系列。
Hugging Face 數據也顯示,基于Qwen 系列二次訓練的衍生模型高達 5 萬多個;這說明 Qwen 系列在開源市場上非常有影響力。
不過,既然阿里已經有通義、夸克這些產品了,為什么又單獨搞了個 qwen.ai ?這個地址接入的 9 個模型到底是干嘛的?
我觀察到,qwen.ai地址更像為想直接使用模型的人設計的一個 Chatbot;不過,這里接入的模型基本是超大模型或高性能模型。
比如:Qwen2.5-Max ,雖然官方沒明確說它是千億參數模型,但根據阿里的命名規則,「Max」通常代表最大參數規模,甚至可能接近千億級別。
而且,模型后面還有一行小字:最強大的千萬語言模型。我猜,這個模型可能是阿里為未來iPhone智能助手這類場景準備的。
既然如此,一個接近千億參數的模型到底能干嘛呢?我覺得主要有四點:
首先,它是一個超大規模的知識庫,世界最大的圖書館跟它比起來都顯得小。無論是醫生診斷疾病、律師解答法律問題,還是科學家研究新藥,甚至想從一堆文檔里快速找到關鍵信息,它都能分分鐘給出答案,只有你想不到,沒有它做不到。
其二,它能幫完成特別復雜的任務。
想讓它同時處理文字、圖片、視頻,生成一些高質量的東西,完全沒問題。你也可以給它一些燒腦的問題,類似于,預測天氣、設計新分子結構,它也能幾秒鐘內給出答案;我測試過幾次,確實很強大。
第三,它可以扮演各種角色。
什么角色呢?情感導師、畫畫、編程?不止如此。昨天,我對它說:你是一名頂級心理學研究者,請從專業角度分析某個問題。它的回答往往讓我眼前一亮,超越了我的認知邊界。
再有一點就與科技有關了。這個模型能幫你加速科學發現。預測蛋白質折疊、跨領域知識融合等,它的回答都非常專業。
所以,一個千億參數的模型,不只是「聰明」那么簡單,更像一個無所不能的超級工具。
我問了下它,你的最新知識庫時間是什么時候,它說:2024年12月;這意味著,兩個月前的知識都已經存儲在它的大腦中。
除Qwen2.5-Max,這里還有Qwen2.5-Plus(擅長處理復雜任務)、Qwen2.5-VL-75B-Instruct (最大視覺模型)、Qwen2.5-Coder-32B-Instruct (專精編程)等。
我發現,模型還可以組合使用,比如用 Qwen2.5-Plus 的同時調用一個編程模型。
另外,昨天凌晨 5 點,阿里發布深度思考 (QwQ)模型,官方介紹說它擅長數學理解、編程和AI 智能體等任務,如果把它的能力和其他模型結合起來,簡直就是性能小怪獸。
我還注意到,這次新增聯網搜索功能(之前沒有),但文生圖、文生視頻功能暫時還未開放;也有用戶反饋說推理模型偶爾會出錯,畢竟這是 Preview(預覽版),還需要時間進一步完善。
盡管如此,即使是千億參數的大模型,在處理內容時仍然存在幻覺問題。
昨天寫一篇文章,誤把 DeepSeek 創始人梁文鋒寫成桑文鋒 (神策數據的創始人)。把 4000 字的內容交給模型檢查,結果它沒發現這個錯誤。這種問題提醒我們,大模型并非萬能。
可能是因為內容太長,或者對話次數多了,模型就容易「迷糊」了吧。
用 qwen.ai 還有一個小技巧:如果用蘋果電腦,覺得窗口太大影響操作,可以點擊 Safari 瀏覽器右上角,共享按鈕,將頁面添加到程序塢,然后縮小窗口。這樣桌面就成了一個高效的工作臺。
目前它也有一個痛點:不支持語音輸入。
不過,這對我來說不是大問題,因為一般會用豆包的語音功能解決。通過快捷鍵呼出語音輸入,對著電腦說完后直接轉成文字,粘貼過去就行,非常方便。
快去試試。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.