早上起來,照例喝上兩杯咖啡上個茅房。蹲坑拉屎的時候刷刷頭條。就看到老詹寫的這個:
伴著括約肌的舒暢就簡單的回復了一下:
拉完了,那么咱們就展開說說:
對于大語言模型,其實國內的項目都很拉垮。這話說的很絕對,但事實上總結一下就是“在坐的都是垃圾”。別怪W君口冷,但自己看到的事實的確如此。
W君先不否定DeepSeek的“火”,只不過要了解一件事情的發展脈絡,首先是不是要先問幾個為什么呢?
DeepSeek的爆火,從本心上來說W君還是很高興的,理由有三個:
第一、這是一款很具有象征意義的產品,在提振我們的士氣方面有著榜樣性的作用,可以說我們用了中國人特有的智慧打破了西方的封鎖壟斷,在大模型這條被西方列強設下層層壁壘的領域走出了自己的一條路。這件事是絕對要點贊的事情
第二、DeepSeek爆火這件事本身成為新聞熱點對普通國人認識和了解人工智能技術是有積極的促進作用的。之前對人工智能的各種不切實際神乎其神的傳說現在就觸手可及的擺在了大家面前,雖然W君說DeepSeek還是一碗土豆粉,但這碗土豆粉可以擺在大家的面前,讓大家了解到它和粉條還是有區別的,這就是爆火的意義所在,也值得點贊。
第三、DeepSeek是破局的嘗試,它啟發了專業團隊從另一個角度考慮問題,不再拘泥于算力霸權,發揮了中國人多快好省的思路,這是一個大語言模型領域中勝天半子的妙手,讓我們從更新的角度來看待大語言模型的訓練和使用,也是一件值得稱贊的好事。
好了,彩虹屁就到這里,否則就不是W君的風格了,說下為什么DeepSeek就是一碗土豆粉:
W君自己實際上在很早很早之前就把人工智能放在了很多的工作上,畢竟,人嘛“懶”是第一必要性。在2015年的時候,我們就推出了一個簡單的人工智能”對話“模型,用在自己的公眾號上和粉絲互動聊天,解決一些日常的交流和溝通的問題。
其實實現起來挺簡單的,甚至都不需要通過神經網絡僅僅利用數據庫查詢的方式就可以達到目的——提取一句話的關鍵詞向量,在歷史對話中找到最貼近的一句話再進行轉譯,對話的時候根據AI自己發出的內容和用戶回復的內容再進行新的一輪學習,以至于到最后這個方式也成功的忽悠了粉絲們很多年。直到17年,有粉絲問一些涉及港臺的問題,這個功能就漸漸下線了。
再后來引入了神經網絡并結合之前積累的對話數據和文章數據對粉絲的作品進行評價打分,這個AI也就徹底的淪為了一個后臺工具不與粉絲直接見面了。
A.I.莉莉娜其實就只是一個例子,在工作生活的各種領域,其實都有很多人工智能的工具替著W君在干很多的具體工作。甚至W君自己的家本身就被裝成了一個巨大無比的電腦系統,無時無刻的享受著人工智能帶來的便利。
當然了,很多人難以想象連床底下、沙發底下都有小主機
滿屋子遍布攝像頭
每個月電費過千的智能化生活是什么樣子的,但是W君是可以負責的告訴你——真T·M·D爽。
其實大家也不用羨慕或者不屑,這本身就是未來的方向,只不過W君現在來看市場上并沒有真正可用的智能生態系統,也就自己在家里搞了一個相當土炮的“土豆粉”方案。至少W君認為大方向還是對的。
大語言模型實際上也和W君的家是一個樣子的。目前世界上并不存在一個很好的方案來真正的幫助大家實現真正有價值的正向增益。
實際上就和智能家居一樣,在大多數人用起來最終的感覺就是“也就那么回事”,也像@詹國樞一樣沒有徹底的把大模型玩明白,就下了一個判斷“DeepSeek的致命傷——說假話”。W君也是和老詹一樣,在很久很久之前就把大語言模型的AI放在了寫文章的工具的位置上。
但不一樣的是,我們較為深度的發掘了大語言模型的功能。最初軍武數據庫是有一個編輯部的,三教九流的什么編輯都有,從退役的參謀到剛畢業的大學生在人員配置上還算齊全,在有一段時間里面軍武器數據的文章中會出現不止W君這么一個花名,還有很多其他的。當時為了讓不同水準的人寫出高質量的軍事類文章,我們是有一些內部的工具的。例如在確定了一個發文計劃的時候就會進入構筑文章內容的過程。這時候我們就利用了AI的架構
定義了一個文章結構的決策樹先將編輯們要寫的文章的大綱整理出來。其實,現在這套決策樹系統也在用,已經和ChatGPT高度整合。
當然了,我們還有一些不能讓大家看到的很多數據庫的接入系統,只做內部參考使用。但就目前的簡單寫作功能,實際上ChatGPT就已經比很多的真人編輯要好用多了。
而且,這個系統可以快速的修改風格和理解編輯意圖,例如:
這其實才是AI寫作的真正用途,不過,在此之前的設定和提示詞其實是要特別的微調和設計的。
做個對比,在這一點上DeepSeek實際上還有很遠的路要走,甚至是以目前為DeepSeek的架構設計基準是根本做不到的。
不過,現在大多數國人嘛總是習慣接受碎片化的信息,所以知道前面說的DeepSeek爆火的三個讓W君高興的理由也就夠了。
而真正動心思去用大語言模型的大多數人往往就覺得大語言模型能給自己偷點懶也就是基本上訴求了。
而至于DeepSeek到底是說真話還是說假話并不在大多數人使用AI模型的需求之列。那么即使是容忍DeepSeek的“說假話”現在這個工具真能用在W君的工作中了嗎?
還真別說,嘗試過了,依舊是不能!在春節期間W君自己寫了一個Chrome插件“頭條創作助理”。
干什么用的呢?主要是用來自動化刪除不和諧的留言的,現在網友素質良莠不齊,因此有必要做一個AI助手來判斷一下大家的留言,哪些顯然沒有長腦子的話該刪除的就刪除掉、該拉黑的就拉黑。
當時就考慮了使用DeepSeek的AI模型執行判斷,主要是因為DeepSeek相對便宜,這些操作如果扔給ChatGPT來做,每天可就要產生相當可觀的費用了。但是經過幾天的實際使用,錢的確是沒花多少,只不過大部分時間把信息發給這個模型,最終是等不來結果的。
今天我們再去看這個模型的后臺界面就發現實際上在1月底的這幾天一共就花了三毛八分錢。但上面的橙色提示是幾個意思?“當前服務器資源緊張,為避免對您造成業務影響,我們已暫停 API 服務充值。存量充值金額可繼續調用,敬請諒解!”這對于真正的大規模付費應用來說就是用完了余額就不能再用的節奏了?這碗土豆粉還是稀罕貨了?
所以,從2月1日給火山引擎沖了10塊錢,把這個“頭條創作助理”的AI部分直接轉入了豆包大模型。選了一個簡單的小規模模型,一天就一分錢而已
但別小看這一分錢,每天在做自己的“清朗”行動。
真就讓哪些狗屁不通的留言玩氮氣去了。
其實,這就是AI真的能幫你做的事情之一,但就目前DeepSeek的服務質量來說以及現在不讓充值的問題來看,這種事情DeepSeek依然是做不來。不好意思,W君會冷靜的用腳投票,只會認為這碗土豆粉里面或許還有食品添加劑的問題了。
昨天還爆出了DeepSeek被ai的頂級域名指向的新聞,各種報道又一輪鋪天蓋地的“遙遙領先”,其實說句真正用AI的用戶的真心話,有那些錢升級下服務器資源不好嗎?土豆粉用檀木盒子裝不還是土豆粉嗎?更嚴重的是“問題不是它便宜嗎,而是它連便宜都做不好!”
再說AI的“虛情假意”的事情,咱們就不說DeepSeek了,畢竟這種條件的DeepSeek根本做不了深入交流。例如這樣的事情大家是不是都能看到?
大部分使用經歷很難讓W君真正的判斷DeepSeek的真實功能,畢竟開頭一句話可以回答,再說第二句就是“服務器繁忙,請稍后再試”了。而且W君覺得自己所遇到的問題并不是一個“個例”。好歹人家qwen還能有個“三句半”呢,這個DeepSeek更傲嬌,只有“一句”,我用你啊!搜索引擎都比這個的用戶體驗好。
那真正的“虛情假意”的是誰?看前幾天發的微頭條的一個例子吧:
給大伙看下大圖:
W君只能說太政治正確了,而且妥妥的具有AI的求生欲。
另外,大語言模型都定位于自己是一個“智能助理”,但你知道智能助理對你的了解嗎?
那大家和deepseek混了很久了,deepseek對大家的評價又是什么呢?
所以……吃土豆粉的人真以為自己吃的是魚翅嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.