就在全球華人喜迎除夕之時,DeepSeek又“偷偷”發(fā)布了新的視覺多模態(tài)模型Janus-Pro-7B!
在多個基準測試中,該模型擊敗了OpenAI的DALL-E 3以及Stable Diffusion。
最關鍵的是,它只有7B,這意味著即使是普通電腦也能運行,真可謂把低成本貫徹到底了。
有趣的是,就在不少人質(zhì)疑DeepSeek-R1多模態(tài)能力不行的時候,DeepSeek直接就在美國時間甩出新模型狠狠打臉。
不出意外,英偉達的股價再次慘跌。
開源多模態(tài)小模型,強到離譜?
DeepSeek多模態(tài)模型的名字叫Janus(雅努斯),在羅馬神話是羅馬人的門神,也是羅馬人的保護神。同時,這也是英文一月的來源。
巧的是,該模型發(fā)布的時候剛好是中國人的除夕,剛好也有“貼門神”的習俗。
一家當前火遍科技圈的中國公司用這樣一個名字震撼了華爾街,真實的商戰(zhàn)果然十分樸實無華。
回到模型上,據(jù)官方介紹,Janus-Pro 是一個統(tǒng)一的理解和生成 MLLM,它將視覺編碼解耦,以實現(xiàn)多模態(tài)理解和生成。
此外,該模型基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 構(gòu)建,使用 SigLIP-L 作為視覺編碼器,支持384 x 384 圖像輸入。
重點就是這個獨立視覺編碼,即通過獨立設計的理解編碼器和生成編碼器,顯著減少生成和理解任務之間的沖突。
因此從相對于其他的模型,Janus-Pro的優(yōu)勢在于簡單性、高度靈活性和有效性。說簡單點,就是不需要什么條件,甚至用消費級GPU就能運行。
當然,畢竟是小模型,Janus-Pro雖然理解能力達標,但在圖像生成能力上還是受到了分辨率的限制(384 x 384),這會對部分操作產(chǎn)生影響。
例如在生成人臉細節(jié)時,低分辨率以及畫質(zhì)損失就會被無限放大。
當然,作為一個完全開源的多模態(tài)模型,Janus-Pro再次為DeepSeek賺足了話題度。
做空英偉達?多只美股再次暴跌
就在Janus-Pro發(fā)布的同時,美股再次集體暴跌,包括英偉達、臺積電、博通在內(nèi)的多只美股都暴跌超過10%,且在收盤前還有下跌的空間。
簡單來說,支撐英偉達高股價背后的核心邏輯還是AI的“高成本”,包括高算力、高端芯等等。
包括前不久特朗普上臺后力推的星際之門計劃,同樣也是用燒錢的方式撐起一個夸張的AI基礎設施體系,并且真實的花費可能遠不止5000億美元。
然而DeepSeek的做法,就是用輕量化證明了算力也可以低成本,這無疑直接打了這些美國科技公司的臉。
最直接的例子就是將AI與超大規(guī)模算力中心綁定的博通,這家靠著ASIC芯片低調(diào)賺錢的半導體公司,在這兩天股價跌得比英偉達還離譜,可以想象投資者們看到DeepSeek的產(chǎn)品后,突然恍然大悟!
當然,我們也不能一味吹捧DeepSeek,無論是DeepSeek-R1還是Janus-Pro,缺陷還是存在的。
但當這家中國公司成為開源模型的代表“意外”戳破了美股的AI泡沫后,這些缺點都可以被忽略不計了。
本文作者:jh,觀點僅代表個人,題圖源:網(wǎng)絡
記得星標微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.