最近國內很火爆的幻方DeepSeek ,據說可以用十分之一的算力就能實現OpenAI最新版本的數理推理能力,你們不要誤會,不是它的技術更牛,而是它創新一種獨門絕技,就是將算力進行分工。
用通俗易懂的話來講,就好比一個工廠有多個車間(這里的“車間”就是指模型中的“專家”),每個車間都有自己擅長的工作,在DeepSeek的模型中,這些“專家”會根據實時的工作任務和自身的處理能力,智能地分配任務。
如果某個車間(專家)特別忙,而其他車間相對較閑,DeepSeek的模型就會自動將一些任務從忙碌的車間轉移到空閑的車間,以確保工作能夠更高效地完成,這樣的動態調整,不僅避免了某些專家過載而影響整體效率,還確保了每個專家都能在其能力范圍內高效工作。
此外,DeepSeek還采用了一種特殊的方法,為每個專家設置動態的負載閾值,當專家的負載超過這個閾值時,就會觸發負載調整機制,模型會綜合考慮多個因素(如專家的歷史處理效率、當前任務的緊急程度等)來進行任務的重新分配。
這種分工方式,就像是在一個團隊中,每個人都有自己的專長,團隊領導會根據每個人的能力和當前的任務需求,靈活地分配工作,以確保整個團隊能夠以最高的效率運作,使得DeepSeek能夠在保持高性能的同時,大幅降低所需的算力資源。
現在全球都在大力投資發展AI模型,但是對于用AI怎么去掙錢,目前都只是在探索階段,還沒有什么具體頭緒,頂多收一點會員服務?費,比如國外一些知名的AI軟件收費情況大都是每月20-30美金,而國內的文言一心和?快手可靈?每月會員費幾十塊人民幣,生成圖片和生成視頻收一點錢,這點錢都不夠團隊發工資的,怎么賺錢。
但那些給ai賣鏟子的公司已經賺錢賺麻了,比如英偉達、博通,而我們國內的ai龍頭是被爆炒還在虧損中的寒武紀。
有意思的是,出資研發deepseek公司的竟然是國內著名量化私募機構幻方,幻方的老板梁文峰持有deepseek公司83%的股權,他用這么牛逼的技術在股市上割韭菜,割的是游資和散戶一片哀嚎。
但更有趣的是,這個團隊都是浙大出來的,他們炒股賺錢的目的是為了做AI,而不是做為了做AI賺股市上的錢,浙大出來的人腦瓜子就是靈活,搞科研都可以不需要去申請科研經費,把自己的研究成果拿出來在股市上收割一波,拿著錢去買英偉達卡繼續做大模型。
坊間傳聞幻方量化曾對超算集群系統投入 10 億元,搭載了超 1 萬張英偉達 A100 顯卡,里面的錢肯定有我的微小貢獻。
雖然目前ai模型現在沒有一個掙錢的(炒股的不算),但我們普通人已經享受到了AI帶給了我們的方便,比如提高工作效率,長途開車自動駕駛,協助寫文章等等,都很實用。
小米現在也在發力做ai,也在沖刺這個賽道,雷軍千萬年薪聘請95后天才女工程師,就是之前在幻方、deepseek團隊工作的羅福莉,目前國產模型的水平正在快速追趕美國ai,可以想見在未來的一段時間里,ai會是科技賽道上最熱門的概念,吸引更多的資本流入。
資本都是無利不起早的一群餓狼,不要擔心他們怎么掙錢,只要能對我們普通人有用,方便大眾的,我們都應該支持,你說是吧?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.