OSCHINA
相信經常網上沖浪的朋友對下面這個賬號應該不會陌生:
沒錯,正是微博上知名的 AI 博主 ——「愛可可-愛生活」,粉絲數近百萬,日更不斷,致力于傳播前沿 AI 技術。
陳光,北京郵電大學人工智能學院副教授,中國人工智能產業發展聯盟具身智能工作組秘書長,主要研究方向是文本計算和具身智能等。擁有多項發明專利,主持、參與國家重大專項、核高基、國家 863、國家自然科學基金等多項國家級項目,在國際高水平期刊和學術會議發表論文數十篇。 創辦微博賬號 “愛可可-愛生活”,聚焦人工智能主題,以專業的學術品味、廣闊的領域視野、敏銳的業界觀察、豐富優質的資源推薦,為廣大人工智能、機器學習和數據科學愛好者所熟悉和喜愛。多次在團中央、發改委等企事業單位作大模型和人工智能報告,是人民網 “全國大學生同上一堂人工智能大課” 主講專家。 著有《DeepSeek 全攻略》、《走進具身智能》等廣受歡迎的科普書。
上周,OSCHINA 有幸邀請到了陳光教授(@愛可可-愛生活)做客「高手問答」欄目,和大家一起聊聊 AI。
下面是部分問答回顧:
1. Deepseek以來,很多人開始做AI本地部署,這個是否有必要?
2. 繼續上一個問題,端側AI的計算類型千奇百怪,目前有沒有比較好的端側AI框架,能夠覆蓋盡可能多的計算設備?
1、是否有必要本地部署AI要"視具體情況而定",主要取決于以下因素: 隱私與安全需求:數據敏感度越高,本地部署價值越大 使用頻率與成本:高頻使用場景下,本地部署可能更經濟 定制化需求:需要專門訓練或調整的場景更適合本地控制 基礎設施能力:擁有足夠計算資源的組織更容易實現本地部署 Deepseek的出現降低了本地部署的技術門檻,為更多場景提供了選擇的可能性,但這并不意味著所有人都需要走本地部署路線。最優解應該是根據具體需求選擇最合適的部署方式。 如果需要在多種設備上部署AI模型,目前較為實用的方案是: 1、以ONNX為中心的工作流: - 訓練模型轉換為ONNX格式 - 針對不同設備選擇最優運行時(ONNX Runtime、廠商SDK等) - 利用設備特定的量化工具進一步優化 2、基于編譯優化的方案: - 使用TVM或類似技術針對目標硬件編譯優化模型 - 犧牲一定開發便利性,換取跨平臺性能 3、混合部署策略: - 高端設備:PyTorch Mobile/TFLite提供完整功能 - 中端設備:ONNX Runtime配合量化模型 - 低端設備:ncnn等超輕量框架運行特別優化的模型 綜合來看,沒有完美的"一站式"解決方案,但ONNX生態系統結合特定優化工具鏈,是目前覆蓋范圍最廣的方案。
一個比較寬泛的問題。對于大齡程序員來說,是轉AI Infra呢,還是繼續做AI應用?
對大齡程序員而言,AI Infra和AI應用并非非此即彼的選擇,而應基于個人優勢和市場需求做出決策: 如果有系統底層或分布式系統經驗,轉AI Infra可能更有優勢,尤其是在可靠性工程、性能優化方面; 如果有豐富的產品開發或業務理解,繼續AI應用可能更有價值,特別是領域特定AI應用; 最佳定位可能是中間層:AI平臺工程、MLOps、AI應用架構等連接基礎設施和應用的角色; 降低風險策略:打造"T型"技能組合,一個方向深入,同時保持另一方向的理解。 大齡程序員的優勢在于對技術完整生命周期的理解,而非單純的開發速度。選擇應該基于個人興趣、現有技能和自我的價值主張,而非僅僅追隨市場熱點。
個人覺得現在的生成式AI有替代搜索引擎的勢頭,博主認為,AI會替換現在的傳統搜索引擎的商業模式嗎?
個人覺得,生成式AI不太可能完全替代傳統搜索引擎的商業模式,而是會重塑信息獲取的生態系統。搜索引擎正在整合AI功能,AI工具在增強檢索能力,兩種技術正走向"AI增強搜索"和"搜索增強AI"的雙向融合。 短期內,廣告模式仍是主導(搜索引擎最擅長),中期,可能出現混合模式——基礎搜索免費+高級AI功能訂閱,長期,可能形成新型的注意力經濟模式。簡單問答和綜合類查詢可能轉向AI,需要多角度信息、最新信息和深度研究的查詢仍依賴搜索,不同人群會采用不同的工具組合。 贏家最有可能是擁有海量數據和計算資源的科技巨頭、能同時提供搜索+AI體驗的平臺,以及在特定垂直領域提供專業化AI+搜索解決方案的新玩家。
DeepSeek的“低成本”部署是否是偽命題?之前部署了個7b的模型,速度慢的一批,感覺沒法用呀。
DeepSeek 的“低成本”部署并非偽命題,但效果取決于硬件和配置。7B 模型在低端硬件上速度慢是正常現象,因為“低成本”指的是硬件門檻低,而非保證高性能。 “顯存夠大能跑起來”和“速度夠快能用起來”是兩個不同的方面。
我在使用r1的時候,最怕的就是幻覺問題,感覺他太過發散,我之前試過讓它把我寫的問題進行分類,這么一個簡單的需求得到的內容卻發現它把一個問題重復歸納到了幾類,而且過于發散進行了不現實的擴展。包括之前讓它生成一些問答,都特別的假,不像是人類會說出來的,這個比較頭疼。
幻覺是目前大模型實用性的關鍵障礙之一。用戶需要的往往是工具而非創意伙伴,但模型卻在"創造性"和"幫助性"之間搖擺。解決方案可能包括:提示詞工程或增加額外約束來控制輸出。 另一個有效的辦法可能是將任務分解成更小、更明確的子任務,并為每個子任務設定明確的評判標準,而不是讓AI一次完成復雜任務。這符合"窄任務會得到窄答案"的原則。
本月初,陳光教授出版了新書《DeepSeek 全攻略》,本書以通俗易懂的問答形式,帶你零基礎入門 DeepSeek,揭秘其智能內核與技術優勢,探索辦公、教育、醫療等領域的無限應用。從理性認識 DeepSeek 的能力邊界,到掌握提示詞優化的實戰技巧,本書助你快速上手,玩轉 DeepSeek,在 AI 時代搶占先機!
京東購買地址: https://item.jd.com/14396069.html
購買地址:
DeepSeek 的橫空出世,就像一塊巨石被投入國內 AI 行業這潭平靜的湖水,激起了千層浪,徹底攪動了原有的格局。如果說之前的國內 AI 行業還是一汪相對平靜的池塘,那么 DeepSeek 的出現就仿佛引爆了一場 AI 海嘯,其影響之深遠,波及范圍之廣闊,都遠超人們的想象。
但隨之而來的,是公眾對 DeepSeek 的諸多疑問:
DeepSeek 到底是什么?
它從何而來?它為何能 “爆火”?
什么是 DeepSeek-R1 的 “滿血版 “和 “蒸餾版”?
DeepSeek 的 " 低成本 “優勢是如何實現的?
DeepSeek 能在本地部署嗎?
DeepSeek 采用了哪些獨特的技術?讓它如此高性能?
和 DeepSeek 對話有什么 “話術” 嗎?
面對等等這些疑問,我們需要一本通俗易懂、深入淺出的科普讀物來撥開迷霧,揭示 DeepSeek 的真相,幫助我們更好地理解這項技術,理性地擁抱 AI 時代。這便是陳光教授撰寫 《DeepSeek 全攻略》的初衷。
↓分享、在看與點贊~Orz
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.