AI的免費與智能,也難以掩蓋數據偏差與大模型“幻覺”帶來的不確定性。當高考志愿填報大模型遇上“幻覺”,被耽誤的,是誰的人生?
作者|夏小舒
編輯|劉珊珊
高考結束了,學子們為自己十多年的寒窗苦讀給出了一個交代。但緊接著他們將要奔赴第二戰場——高考志愿填報。俗話說三分考七分報,志愿填報重要性一點也不亞于高考本身。
這段時間,又到了志愿填報各路人馬、機構、工具活躍的季節。
先是前幾天,張雪峰因“在直播間含淚退出”登上熱搜。視頻中,他眼含熱淚,跟觀眾坦誠“動了太多人的蛋糕”“這可能是你最后一次在網上見到我”“我真的已經盡力了”“張雪峰沒有對不起任何人”。
隨后不到一周,張雪峰又發表“復出宣言”,宣布6月15-6月30日將在快手平臺連續進行15場直播連麥。從宣布告別直播到火速付出,反轉比翻書還快。
張雪峰大火之外,諸多AI志愿填報工具應運而生。
近日,夸克發布首個高考志愿大模型,宣稱能為考生專屬定制高考志愿填報分析,并且免費開放給所有人使用。面對張雪峰動輒成千上萬的咨詢費,免費的AI工具似乎是一個更具性價比的選擇。
但AI工具同時也潛藏著隱患,因為目前市面上所有的大模型工具都沒有解決幻覺的問題。一旦AI志愿填報出現了幻覺,誰來為考生的前途負責?如果所有家長和考生都把希望寄托在AI工具上,到底是技術革新還是誤人子弟?
01
工商專業重點推薦,
夸克AI志愿填報靠譜嗎?
打開夸克瀏覽器,可以看到有個一級入口“夸克高考”,整體可以分為志愿預估、專家直播、各大高校排行榜等界面。還在小圖標欄有“同分去向”“一分一段”等10個實用小功能。
值得一提的是,在填志愿部分,夸克高考全部接入了張雪峰的視頻,打造了一個“張雪峰教你填志愿”欄目。從這一點可以看出,夸克高考填報志愿并不是要取張雪峰而代之,而是定位于一個AI工具,輔助人類做出決策。
在高考熱議欄還有“聊志愿”和“許愿墻”兩個功能,最后回復時間比較近,“1小時前”“2小時前”,可以看出這個功能使用人數還是比較多的。
點擊首頁預估成績按鈕后,會跳出來信息填報,填好分數和科目之后,還需要填地域偏好、專業偏好、職業傾向等個人檔案。
填好之后,就可以看到相應成績檔位的志愿預估填報了。按照“極點商業”輸入的“540分重慶考生,物化生”條件,可以看到下面的志愿填報推薦分為“沖”“穩”“?!比齻€檔次的學校。
輸入相應分數后,首先跳出來的是該分數對應的位次“38580”名,這個位次是參考2024年高考信息得來。
在右下角有個“我的志愿”按鈕,考生選擇自己心儀的學校和專業后,可以在志愿表內看到每個志愿的錄取概率。夸克還會生成表格,列出每個專業的分數和位次,更具參考價值。
并且夸克還會根據預估志愿出具一份詳細的志愿分析報告。里面包括情況分析、核心填報策略、重點志愿強調、以及志愿風險提示。
值得一提的是,夸克還升級了搜索體驗,提升到了AI深度搜索。在對話框里輸入相應的問題就可以得到智能回答。例如搜索“540分有什么985推薦”,下面就會跳出來智能回答。讓人意外的是,夸克沒有根據提問預設篩選一些985高校,而是自動匹配了540分數段對應的院校推薦。
不過夸克推薦的“部分專業就業良好”,有待商榷,不僅出現了天坑的“生化環材”,就連計算機、英語、工商管理,也在就業前景良好重點推薦之列。
計算機程序員的互聯網紅利早已過去,隨著AI翻譯的發展,英語就業也越來越難。剩下的市場營銷和工商管理,又被戲稱為“萬金油”專業,就業也是難題。由此可以看出夸克的志愿推薦并不是那么靠譜。
而根據博主“Caber-維克托”測試來看,上述情況在浙江也有出現??淇酥攸c推薦的“浙江海洋大學計算機系”,不在該校官網前24個專業推薦之列。按夸克的分析,該專業在浙江省內認可度較高,但根據博主說法,業界對此認可度普遍不高?!翱瓷先ビ心S袠拥姆治?,實際上容易形成誤導?!?/p>
上述博主認為,AI結果和大模型的訓練數據、推理能力等息息相關。從夸克AI選志愿實際表現看,訓練數據質量并不高,或者推理能力有待提升。
根據“極點商業”搜索來源顯示,夸克給出的答案都源于“夸克高考知識庫”中,也就是夸克宣稱的,夸克的信息服務覆蓋2900多所高校、1600個專業及100多個主要城市就業數據。所有數據和信息都是來自官方考試院、官方高校、教育部、行業專家共建等的權威渠道,是可靠的信源。
但是在下圖中的搜索源頭顯示,網易這類第三方非官方網頁數據也名列其中,不由得讓人懷疑夸克高考搜索的準確性,以及開始擔憂大模型的幻覺問題。
除了網易內容,夸克搜索的第三方網頁來源還有頭條號、以及私人博客。這明顯與夸克宣稱的“所有信息和數據都來自官方網站或權威渠道”不符。
值得一提的是,搜索框問題明明是“985大學有希望嗎?”可夸克搜索的給出的網頁結果,卻是“熱門工科專業有哪些?”未免有些牛頭不對馬嘴。
02
幻覺問題沒解決,
謹防大模型誤人子弟
眾所周知,志愿填報是影響人生一輩子的大事。其重要程度不亞于高考本身,甚至更甚,能夠改變一個人的前途和命運。正因如此,家長不惜一擲千金,養活無數價格高昂的志愿填報服務機構。
高考志愿填報費用已經破萬,張雪峰推出12999元的夢想卡和18999元的圓夢卡,上線20鐘即售罄,反映了高考志愿填報背后家長們的焦慮與期盼。
高考志愿填報本質上是一門信息差的生意,但信息差會隨著政策透明化和市場競爭而逐漸縮小。眼下,AI技術發展讓教育普惠成為可能。更多沒錢報志愿服務的人,可以借助互聯網與AI技術打破信息差,自己進行志愿填報。
問題是,看似向好局面下暗潮涌動。例如,至今幾乎所有AI大模型都未徹底解決幻覺問題,數據和資料胡編亂造、來源不明比比皆是,其風險就可能誤人子弟。
邏輯思維聯合創始人“快刀青衣”就表示,一旦AI高考大模型出現幻覺問題,向考生推薦了錯誤的志愿填報信息,導致考生無法被心儀院校錄取甚至滑檔,這個責任誰來承擔?誰來為考生的前途負責?
在夸克大模型的早期訓練過程中也出現過幻覺現象,出現了一些不符合實際的情況。例如只要考生提及中外合作,模型就會把中外合作排序優先,但實際上中外合作費用高昂,且屬于特殊招生,應該往后放。還出現了給500分考生推薦985院校的情況。
從“極點商業”最新測試來看,雖然夸克不再給540分考生推薦985院校了,但是大模型始終會出現幻覺,無論再怎么降低,這個概率也不會是0。即使只有萬分之一,在志愿填報這種人生大事上,一旦遇到了就無法挽回。
例如,在社交平臺上就有人發現夸克高考的數據跟官方數據對不上。
以福建中醫藥大學為例,“康復物理治療”專業在湖南省2023年夸克高考上的分數線為490分,而根據官方數據該項分數為419分。
該發言為2024年,而2025年的現在“極點商業”去夸克官網上查詢該數據,已經校準為419分。不過該數據錯誤對于2024年的考生而言,卻有著極大的影響。
2024年被影響的還不止上面一位,還有用戶在社交平臺上曝出,自己是2024年的江西考生,物理組高考442分,他嘗試用夸克來填報志愿,結果所有學校都滑檔了。
在更早的2023年,被影響的人就更多了?!翱淇瞬豢尚拧薄爸驹富瑱n”“一本的分數卻報了二本大學”“非常后悔”。
再比如,極點商業這次測試的考生信息為“重慶物化生540分,名次38580。”在推薦報考的院校里,分為“沖穩保”三擋。
令人費解的是,對于540分段而言,528分居然比533分更“難”錄取??聪聢D的示例,分數為533,位次42243的安徽理工大學,信息顯示錄取概率為59%,可以“沖”。
而分數為528,位次為44926的江蘇科技大學,卻列入了“難錄取”的范圍,錄取概率只有19%。這一反直覺反邏輯的排名規劃,真是讓人有些看不懂。
除了大模型幻覺問題,還有用戶在社交媒體上曬出使用夸克填報志愿的真實感受,指出了夸克填報志愿的一些弊端。例如夸克只有上一年最低分的數據,有可能這個分數是別人補錄撿漏得來的,這樣的話今年沖這個學校就很容易滑檔,或者就是被調劑到垃圾專業。
也有人認為,夸克高考志愿的數據是準確的,但是預測就不太準了。就比如夸克高考上面的院校信息、分數線、招生計劃都是準確的,可是給“極點商業”推薦的報考院校概率自相矛盾,檔次劃分混亂。如果真按夸克高考推薦的“沖刺”“保底”去填報志愿,可能也會落得“滑檔”的下場。
在社交媒體上,無論是考生、高考志愿填報專家、AI大模型負責人,越來越多的人正在形成共識:雖然AI志愿報告已經到達了一定的專業水準,但是不能完全依靠AI做出志愿決定,更多的還是要靠考生自己和家長綜合商量做出決定。
高考志愿填報,是人生十字路口的關鍵抉擇??淇舜竽P偷華I工具的出現,為考生打破信息差,其普惠初衷值得肯定。但是,當大模型遇上“幻覺”,其推薦的可靠性就被打上了問號。從推薦“天坑專業”到用戶的“滑檔風險”,都在讓我們警醒AI便利下的波濤洶涌。
AI的免費與智能,也難以掩蓋數據偏差與大模型“幻覺”帶來的不確定性。夸克大模型可以是一個強大的信息庫,提供數據參考進行輔助,但絕不是唯一的決策大腦。更不能替代考生對人生路徑的主觀判斷,無法兼顧考生的興趣、能力、未來規規劃與職業夢想。
因此,我們可以使用AI工具,但絕不能只使用AI工具。高考填報,更多的是考驗人對自身需求的透徹認知,是十八歲的學子們成年后的第一個“大考”。高考志愿填報的鑰匙永遠屬于考生自己,而這將決定他會打開怎樣的命運之門。
別把前途輕易押注給任何人,或者任何先進的AI智能體。
審慎前行,方不負十年寒窗。
出品人:黃槍槍|直達熱線 13452396140
(請標注公司、職位)
獨到觀點、獨立態度
見證中國商業生態進化、重塑與未來
往期精品
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.