估計大家都不信,23-24這兩年,前后涌現(xiàn)出來的各種國產(chǎn)大模型的數(shù)量起碼有200多個,包括耳熟能詳?shù)奈男囊谎裕x千問,Kimi,更多的你還沒聽過就基本上無了。
如果你感興趣,可以看看這個Github倉庫,名叫「中國大模型列表 Awesome LLMs In China」,列出了絕大多數(shù)的國產(chǎn)大模型,數(shù)量一度達到了245個,時間跨度也近乎兩年。
比如你看這是比較新的幾個,一個也沒聽說過。
最前面的幾個倒是大多數(shù)都聽過且用過,比如百度的文心一言,智譜AI的ChatGLM系列,阿里云的Qwen全家桶等等。
其實迄今為止,能叫得上名字的國產(chǎn)大模型,基本上都有自己的絕活,畢竟這種實用型技術,不開放使用或者開放使用但是性能很差的話,那就幾乎留不住用戶,基本上活不過一周就沒了。
排除掉一直不開放使用的,以及開放使用后發(fā)現(xiàn)性能拉垮的,再把一些雖然沒開放使用但是名氣不小的整理下,能進行排名的國產(chǎn)大模型其實不多,我們先列出來。
公司
大模型
鏈接
百度
文心一言
https://yiyan.baidu.com/
智譜
GLM
https://www.zhipuai.cn/
百川智能
百川
https://www.baichuan-ai.com/home
阿里云
通義千問
https://tongyi.aliyun.com/
上海人工智能實驗室
書生
https://intern-ai.org.cn/home
深度求索
Deepseek
https://www.deepseek.com/
科大訊飛
星火
https://xinghuo.xfyun.cn/
字節(jié)跳動
豆包,即夢
https://www.doubao.com/chat/
商湯科技
商量
https://www.sensetime.com/cn
月之暗面
Kimi
https://kimi.moonshot.cn/
可靈
https://klingai.kuaishou.com/
華為
盤古
https://www.huaweicloud.com/product/pangu.html
復旦大學
MOSS
https://github.com/OpenMOSS/MOSS
面壁智能
CPM
https://modelbest.cn/
騰訊
混元
https://hunyuan.tencent.com/
零一萬物
Yi
https://www.lingyiwanwu.com/
基本上就是這些公司以及對應的大模型,有些模型其實現(xiàn)在已經(jīng)沒有聲響了,比如復旦的MOSS大模型,商湯的商量大模型等等,都是短時間內(nèi)名噪一時,然后就沒有然后了。
到現(xiàn)在為止還在活躍的,其實總體上滿足兩個特性:
第一是本身底蘊強,比如互聯(lián)網(wǎng)大廠,AI技術的積累非常深厚,這里面的代表就有阿里云和百度。
第二是技術獨創(chuàng)性,比如Kimi大模型的超長上下文特性,以及Deepseek優(yōu)化后的超低推理成本等等。
除了這兩個之外的科研機構做出來的大模型,基本上都逃不過后續(xù)再訓練需要的巨額成本。
所以排名的范圍就進一步縮小了。
以下的排名將分為五個子榜,分別從大模型智能水平、產(chǎn)品豐富度、AI視頻子分類、AI搜索、ChatGPT差距大小以及產(chǎn)品潛力。
大模型智能水平
這個衡量的就是大模型夠不夠聰明,簡單來說就是能不能聽懂提示詞以及正確的執(zhí)行。
我們就按中國大模型排行榜這個github庫的資料為參考,并且用國外GPT4系列、Llama以及Gemini作為參考,可以看到零一萬物和百度以及Qwen是排在前三的。
這個維度的比較很難,因為單純從智能角度,這個世界上毫無疑問GPT是第一,但是第二其實是一組,根據(jù)我平時的使用習慣,我覺得以下幾個AI大模型智能程度不分先后。
·阿里云-Qwen
·月之暗面-Kimi
·智譜-GLM4
·深度求索-Deepseek
·字節(jié)跳動-豆包
這個維度是會經(jīng)常更新的,所以也非常考驗公司的研發(fā)力度,這里面就涉及到了資金和人才積累,這幾個要么是都是豪門,產(chǎn)品也發(fā)的快,智能程度總體上不相上下,我覺得中肯。
產(chǎn)品豐富度
AI大模型其實有非常多的衍生產(chǎn)品,比如對話機器人,AI繪畫,AI視頻,AI音樂等等。
像阿里云就比較全面,幾乎所有方向都有涉獵,而相反的公司比如說快手,就專攻AI視頻。
而產(chǎn)品豐富度其實反映了開發(fā)與盈利能力。
這個維度上,我覺得按公司比較好:
1 阿里云,字節(jié)跳動,百度
阿里云有全系列的開源大模型Qwen,還有AI視頻,AI繪畫,AI輔助編程等等,基本上涵蓋了所有的方面。
另外也有絕活大模型服務平臺百煉這樣的產(chǎn)品,非常適合做大模型應用。
字節(jié)也是財大氣粗,基本上涵蓋了絕大多數(shù)方向,且豆包模型在大多數(shù)平臺都可以流暢運行,很好用。百度AI豪門,自然也幾乎是全家桶,并且它還有一手自動駕駛的絕活。
2 月之暗面
Kimi一度非常的火,最開始出來的時候智能水平都快趕得上最新的GPT4模型,后來發(fā)的產(chǎn)品也不少,比如Kimi聯(lián)網(wǎng)搜索。Kimi的產(chǎn)品經(jīng)理大概率是很好玩的年輕人,推出的很多功能都非常的適配年輕人的需求。
AI視頻子分類
這個單獨列出來,是因為AI視頻其實是一個很難做的項目,幻覺問題比文本大模型嚴重的多,且比較難盈利,基本上能活下來的都是背靠大廠。
這里我覺得國內(nèi)有兩個很牛的產(chǎn)品。
一個是背靠字節(jié)跳動的即夢。
另一個是快手的可靈。
放在全世界內(nèi)也是能打的,可以說這倆很難分出個勝負,基本上各有所長,且更新進度很快,特別是提示詞遵循以及動態(tài)效果都已經(jīng)做到了很好的效果。
AI搜索
這是個比較小眾的領域,有些產(chǎn)品是大模型附帶的,比如Kimi的搜索功能,但也有一些就是純粹的AI搜索產(chǎn)品,比如秘塔AI。
這個子領域我覺得比較好用的有:
·秘塔AI:比較全面,另外出的比較早
·知乎直答:獨特的AI搜索產(chǎn)品,大部分為知乎回答
·Kimi搜索
·豆包
后兩個其實是AI大模型公司的衍生產(chǎn)品,不算主打產(chǎn)品,所以用哪個其實很看自己的使用習慣。
ChatGPT差距
這個比較的是追最新技術的能力,比如OpenAI最新的o系列主打Reasoning,其實可以反映出這個領域的最新進展。
而o1其實提出了一段時間了,但國內(nèi)有能力且真正復現(xiàn)的公司只有兩個:
1 深度求索-Deepseek
直接開放使用深度思考能力,每天都有免費字數(shù),復現(xiàn)表現(xiàn)非常的好。
2 阿里云-QwQ
這個是直接開源的,屬實是難能可貴。
https://huggingface.co/Qwen/QwQ-32B-Preview
產(chǎn)品潛力
其實AI大模型到現(xiàn)在,就只有OpenAI與其他公司,而其他的公司之間有差距,但都是肉眼可見的。但AI發(fā)展肯定是一個長期追逐戰(zhàn),能夠有這個潛力的,基本上還得滿足之前提到的條件。
a.資金充足
b.人才儲備
c.技術壁壘
1 阿里云和字節(jié)
這倆無疑資金沒問題,人才儲備也能從豐富的產(chǎn)品線和頻繁的更新上可見一斑,最后技術壁壘大家面臨的差不多,阿里云相比字節(jié)率先實現(xiàn)了reasoning,但是差距不會很大。
2 百度
老牌豪門,只要技術路線清晰,沒道理不會回到一線。
3 騰訊
AI并不是主打,但是架不住有錢任性。
其他的公司我認為融資危機是存在的,從穩(wěn)妥角度上沒有加入排名。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.