DeepSeek-R1“爆火”后,多個云平臺宣布上線DeepSeek旗下模型。
北京時間2月4日凌晨,中國常駐聯合國代表傅聰在紐約聯合國總部舉行記者會,介紹中國本月輪值安理會主席期間的主要議程設置。當被問到中國人工智能企業深度求索(DeepSeek)發布的模型以及中美人工智能合作問題時,傅聰強調,“永遠不要低估中國科研人員的聰明才智。DeepSeek引發全球轟動和一些人的焦慮恐慌,說明技術遏制和技術限制無法奏效,這是全世界、特別是美國需要學習的一課”。
DeepSeek絕對是目前最火的應用,日常寫作、翻譯、問答都能輕松搞定,獨特的深度思考模式加上聯網搜索,在編程、解題、文獻解讀等復雜任務中也游刃有余,推理思考能力一絕。
01
DeepSeek是什么?
如果你對AI有一定的認知,日常已經在使用Kimi、豆包等產品的話,那你就可以類比來理解DeepSeek。DeepSeek中文翻譯叫做深度求索。
深度求索是這家公司的名稱:杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創新型科技公司,專注于開發先進的大語言模型(LLM)和相關技術。
在硅谷,DeepSeek很早就被稱作“來自東方的神秘力量”,也是網上熱議的“杭州六小龍”之一。
2024年底,DeepSeek發布了新一代大語言模型V3,同時宣布開源。測試結果顯示,它的多項評測成績超越了一些主流開源模型,并且還具有成本優勢。
隨后,在本月世界經濟論壇2025年年會開幕當天,中國深度求索公司發布其最新開源模型R1,再次引發全球人工智能領域關注。據該公司介紹,R1模型在技術上實現了重要突破——用純深度學習的方法讓AI自發涌現出推理能力,在數學、代碼、自然語言推理等任務上,性能比肩美國開放人工智能研究中心(OpenAI)的o1模型正式版,該模型同時延續了該公司高性價比的優勢。
據了解,深度求索公司R1模型訓練成本僅為560萬美元,遠遠低于美國開放人工智能研究中心、谷歌、“元”公司等美國科技巨頭在人工智能技術上投入的數億美元乃至數十億美元。
02
DeepSeek的下載途徑
【網頁版】
你可以直接訪問DeepSeek的官方網站(https://chat.deepseek.com),使用微信或手機號注冊。
點擊開啟深度思考 R1,在網頁上輸入你的問題或指令,DeepSeek會即時給出回答。
【APP版】
DeepSeek的APP已經上線,支持iOS和安卓系統。在手機應用商店中搜索“DeepSeek”,下載安裝后就可以隨時隨地使用了。
APP功能強大,支持對話、語言翻譯、創意寫作、編程輔助等多種功能。
03
DeepSeek的功能特點
(一)文本生成
Deepseek 能根據給定提示或上下文信息,生成連貫、有邏輯的文本內容,可用于撰寫文章、故事、詩歌、代碼注釋等,能大大提高創作效率。
(二)問答系統
作為強大的問答系統,Deepseek 能準確回答各種問題,無論是常識性問題還是專業領域問題,都能依據知識和語義理解能力給出準確詳細的答案,可應用于智能客服、知識圖譜查詢等場景。
(三)文本分類
Deepseek 能對輸入文本進行分類,如對新聞文章分類、對用戶評論進行情感分析等,在信息檢索、輿情監測、客戶反饋分析等領域應用廣泛。
(四)機器翻譯
Deepseek 具備機器翻譯功能,能實現多種語言之間的自動翻譯,保持原文語義和風格,為跨語言交流和國際合作提供便利。
(五)對話交互
Deepseek 支持自然流暢的對話交互,能與用戶進行多輪對話,理解用戶意圖并做出合適回應,可應用于智能聊天機器人、虛擬助手等場景。
04
DeepSeek的使用技巧
相比gpt不需要多專業的提示詞技巧,和deepseek說人話就可以。
今天教大家一個簡單四步提問法,讓DeepSeek變身你的“職場軍師”和“流量引擎”!
需要注意的是,以下這些坑千萬別踩。
(一)隱私安全要注意
別上傳身份證、銀行卡照片;
公司機密文件記得打碼再上傳;
(二)結果要核對
重要數據自己再算一遍;
法律文件建議找專業人士復核;
(三)使用要合理
別讓AI代寫畢業論文(查重過不了);
每天對話別超100條,小心系統卡殼。
使用DeepSeek必備的10個技巧
(一)巧用DS的三種模式
DeepSeek的網頁版和APP版,都十分簡潔,只有一個聊天窗口,以至于其APP只有8M大小。
聊天界面提供了三種模式——基礎模型、深度思考(R1)和聯網搜索,可根據不同場景和需求,靈活選用。
基礎模型,于去年12月升級到DeepSeek-V3版,性能比肩全球頂尖的開閉源模型(如4o、Claude-3.5-Sonnet、Qwen2.5、Llama-3.1等)。
不勾選任何功能,即默認使用V3基礎模型。大多數情況下,選擇基礎模型就完全夠用了。
深度思考(R1),是今年1月新發的DeepSeek-R1正式版,效果完全不輸OpenAI o1(只有尊貴的Pro用戶才能使用,200美刀/月),因免費+開源+極低價API,讓DS在這個春節成為“國運”級模型,爆火海內外。
R1是一個愛思考的深度推理模型,主要擅長處理數理邏輯、代碼和需要深度推理的復雜問題。通常,一些寫詩、寫文章的需求,用不到這個模型。
聯網搜索,是讓DS根據網絡搜索結果來回答問題,也就是RAG(檢索增強生成),你可以把它理解為DeepSeek的AI搜索功能。
(二)R1對標o1,V3對標4o
不打開深度思考,啟用的是V3模型,這是DeepSeek的基礎模型,采用Moe架構,671B參數,與GPT-4o、Claude-3.5-Sonnet類似。擅長答百科知識,回答速度超級快。
打開深度思考,啟用的則是R1模型,是類似o1、o3的推理模型,660B參數,采用的是后訓練+RL強化學習,擅長邏輯推理、復雜問題解答,回答速度較慢。
關于4o與o1的區別,一張表說明:如何選用V3和R1模型。
至于聯網功能,通常不用同時勾選深度思考和聯網搜索,不然DS的表現會不太智能。
(三)知識更新至2024年7月
DeepSeek的預訓練數據,更新至2024年7月。
所以,2024年7月前的問題基本上不需要打開聯網功能。而之后的問題DS未學習,建議開啟聯網功能,效果更佳。
(四)提示詞核心:準確表達
DeepSeek,無論是V3還是R1模型,都是不太吃提示詞的,只需要做到【準確表達】即可。
通用提示詞模板=你是誰+你的目標。
br
適當情況下,還可以補充一些背景信息:
你是誰+背景信息+你的目標。
br
也可以是:
我要xx,做xx用,希望達到xx效果,但擔心xx問題……
br
不管哪個模板,其核心都是準確表達。做到準確表達,基本就夠用了。過去學的那些結構化提示詞,可直接丟掉。
(五)與DS溝通,盡量說人話
與DS溝通,盡量說人話。
越是直白、俗氣,就越能激發它的潛能。
模仿風格,你只需要告訴它,模仿誰?寫什么?就夠了。
(六)我是一名小學生
過去,我們經常吐槽AI生成的東西一股子AI味。
其原因是模型輸出太注重結構化,一堆“首先、其次、然后、總而言之”之類的連詞,導致內容太死板。
人類這個感性的動物,最是討厭這些理性的東西,特別是文字領域,八股文、學術文讀起來常常讓人昏昏欲睡。
這種情況,建議你加一句提示:
我是一名小學生 / 請用小學生能聽懂的話解釋。
br
這句提示用在DS里,特別好使,如果進入博士領域,就開始上難度了。
(七)活用聯網搜索
以o1為代表的推理模型,基本上都是不能聯網的。
如果想了解知識庫截止日期后的問題,DeepSeek支持推理+聯網的模型。
(八)活用上傳附件
DS的推理模型,不僅能聯網,還支持上傳附件(最多不超過50個,每個不超過100MB)。
推理+上傳附件,可以做更多本地化、私密化的東西,比如你自己的知識庫或者內部資料。讓其基于自有知識庫進行推理和思考。
(九)活用V3+R1
前面提到,V3是基礎模型,它專注于告訴我們要什么。而R1是推理模型,專注于告訴我們如何思考、推理。
那為什么不能將2個模型結合起來使用呢?比如,先跟V3多輪對話,得到要推理的細節和提示詞,然后發給R1,讓R1再來推理、輸出。這樣,就能將DS的能力又提升一個等級。
(十)R1的3個開放
對于R1模型,DeepSeek做到了3個開放:
1)思維鏈全開放。無論是應用端還是API,都可以看到完整、透明的思考過程。API,通過設置 `model='deepseek-reasoner'` ,即可調用。
2)訓練技術全部公開。DeepSeek在后訓練階段大規模使用了RL強化學習技術,通過極少標注數據,極大提升模型推理能力。所有訓練技術全部公開,目前全球多個研究機構均已復現R1。
3)開源2+6個模型。R1預覽版和正式版的參數高達660B,非一般公司能用。為進一步平權,于是他們就蒸餾出了6個小模型,并開源給社區。最小的為1.5B參數,10G顯存可跑。
最后,用DeepSeek-R1模型的一個問題作為結尾:
“在技術加速超越人類能力的時代,你們將如何重新定義自身的價值與目的,以確保進步的方向始終服務于生命的整體繁榮,而非分裂與異化?”
那么,你的答案會是什么?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.