#商業經濟 #DOGE #AI #埃隆馬斯克
#數據訓練
埃隆馬斯克同時控制著 DOGE 和他的人工智能公司 xAI。美聯社圖片/Jose Luis Magana
政府效率部 (DOGE) 已獲得對至少 7 個敏感聯邦數據庫的前所未有的訪問權限,包括美國國稅局和社會保障局的數據庫。這種訪問引發了人們對網絡安全漏洞和隱私侵犯的擔憂。另一個問題受到的關注要少得多:這些數據可能被用來訓練私營公司的人工智能系統。
白宮新聞秘書表示,盡管埃隆·馬斯克 (Elon Musk) 控制著 DOGE,但 DOGE 收集的政府數據并未用于訓練馬斯克的 AI 模型。然而,有證據表明,DOGE 人員同時在馬斯克的至少一家公司擔任職務。
在美國聯邦航空管理局(Federal Aviation Administration),SpaceX 的員工擁有政府電子郵件地址。這種雙重就業為聯邦數據可能被虹吸到馬斯克擁有的企業(包括 xAI)創造了一個渠道。該公司最新的 Grok AI 聊天機器人模型明顯拒絕明確否認使用此類數據。
我是斜杠青年,一個PE背景的雜食性學者!?致力于剖析如何解決我們這個時代的重大問題!?使用數據和研究來了解真正有所作為的因素!
要剖析這個問題你必須要對政府數據公共來源、政治、科學和技術有所了解,我認為,將政府數據傳輸給私營公司的可能性比大多數報告所確定的要大得多。有能力開發人工智能技術的私營實體可以利用政府數據超越競爭對手,并對社會產生巨大影響。
政府數據對 AI 的價值
對于 AI 開發人員來說,政府數據庫代表著類似于尋找圣杯的東西。雖然 OpenAI、Google 和 xAI 等公司目前依賴于從公共互聯網上抓取的信息,但非公共政府存儲庫提供了更有價值的東西:整個人群實際人類行為的驗證記錄。
這不僅僅是更多的數據,而且是根本不同的數據。社交媒體帖子和 Web 瀏覽歷史記錄顯示了精心策劃或有意的行為,但政府數據庫捕獲了真實的決策及其后果。例如,Medicare 記錄揭示了醫療保健選擇和結果。IRS 和財政部數據揭示了財務決策和長期影響。聯邦就業和教育統計數據揭示了教育路徑和職業軌跡。
這些數據對 AI 訓練特別有價值的原因是其縱向性質和可靠性。與網上提供的雜亂無章的信息不同,政府記錄遵循標準化協議,接受定期審計,并且必須滿足準確性的法律要求。每筆社會保障金、醫療保險索賠和聯邦撥款都會創建一個關于真實世界行為的經過驗證的數據點。這些數據在漂亮國沒有其他任何地方具有如此廣度和真實性。
最關鍵的是,政府數據庫會隨著時間的推移跟蹤整個人口,而不僅僅是數字活躍的用戶。他們包括從不使用社交媒體、不在線購物或主動避免使用數字服務的人。對于人工智能公司來說,這意味著對人類體驗的實際多樣性進行訓練,而不僅僅是人們在網上進行的數字反思。
2025 年 2 月 6 日,一名保安阻止美國馬薩諸塞州民主黨參議員愛德華·馬基 (Edward Markey) 進入 EPA 大樓,查看 DOGE 工作人員在那里工作。圖片來源: Al Drago/蓋蒂圖片社
技術優勢
當前的 AI 系統面臨著根本的局限性,從互聯網上抓取的任何數據都無法克服這些限制。當 ChatGPT 或 Google 的 Gemini 犯錯時,通常是因為它們接受過可能流行但不一定正確的信息的培訓。他們可以告訴你人們對政策效果的看法,但他們無法跟蹤不同人群和年份的這些影響。
政府數據可能會改變這一等式。想象一下,訓練一個 AI 系統,不僅要根據對醫療保健的看法,還要根據數百萬患者的實際治療結果。考慮一下從社交媒體上關于經濟政策的討論中學習與分析幾十年來它們對不同社區和人口統計數據的實際影響之間的區別。
基于綜合政府數據訓練的大型、最先進的或前沿模型可以理解政策和結果之間的實際關系。它可以跟蹤不同人群群體的意外后果,通過實際驗證對復雜的社會系統進行建模,并根據歷史證據預測擬議變革的影響。對于尋求構建下一代 AI 系統的公司來說,訪問這些數據將創造幾乎不可逾越的優勢。
關鍵系統的控制
像 xAI 這樣的公司可以使用基于政府數據訓練的模型做更多的事情,而不是構建更好的聊天機器人或內容生成器。這樣的系統可以從根本上改變——并可能控制——人們理解和管理復雜社會系統的方式。雖然其中一些能力在負責任的公共機構的控制下可能是有益的,但我認為它們在一家私營公司手中會構成威脅。
Medicare 和 Medicaid 數據庫包含幾十年來不同人群的治療、結果和費用記錄。基于新政府數據訓練的前沿模型可以識別出在其他模型失敗的地方取得成功的治療模式,從而在醫療保健行業占據主導地位。這樣的模型可以了解不同的干預措施如何隨著時間的推移影響不同的人群,并考慮地理位置、社會經濟地位和并發條件等因素。
使用該模型的公司可以通過向制藥公司和保險公司展示卓越的預測能力和市場人群層面的洞察力來影響醫療保健政策。
國債數據可能是最有價值的獎品。政府金融數據庫包含有關資金如何在經濟中流動的詳細信息。這包括跨聯邦支付系統的實時交易數據、納稅和退款的完整記錄、福利分配的詳細模式以及帶有績效指標的政府承包商付款。
能夠訪問這些數據的 AI 公司可以開發非凡的經濟預測和市場預測能力。它可以對監管變化的級聯效應進行建模,在經濟脆弱性變成危機之前預測它們,并以傳統方法無法實現的精度優化投資策略。
基礎設施和城市系統
政府數據庫包含有關關鍵基礎設施使用模式、維護歷史記錄、緊急響應時間和開發影響的信息。每筆聯邦撥款、基礎設施檢查和應急響應都會創建一個數據點,幫助訓練 AI 更好地了解城市和地區的運作方式。
力量在于這些數據的潛在互連性。根據政府基礎設施記錄進行訓練的 AI 系統將了解交通模式如何影響能源使用、住房政策如何影響應急響應時間以及基礎設施投資如何影響跨地區的經濟發展。
擁有獨家訪問權限的私營公司將獲得對漂亮國社會的物理和經濟動脈的獨特見解。這可能使該公司能夠開發城市政府所依賴的“智能城市”系統,從而有效地將城市治理的各個方面私有化。當與來自私人來源的實時數據相結合時,預測能力將遠遠超過任何當前系統所能達到的。
絕對數據絕對損壞
像 xAI 這樣的公司擁有馬斯克的資源和通過 DOGE 的優先訪問權,可以比競爭對手更容易克服技術和政治障礙。機器學習的最新進展還減輕了為算法處理準備數據的負擔,使政府數據成為名副其實的金礦——理應屬于漂亮國人民的金礦。
私營公司訪問政府數據的威脅超越了個人隱私問題。即使刪除了個人標識符,分析數百萬份政府記錄模式的 AI 系統也可以實現令人驚訝的預測和影響人口層面的行為的能力。威脅是利用政府數據影響社會(包括選舉結果)的 AI 系統。
既然信息就是力量,那么將前所未有的數據集中在一個具有明確政治議程的私人實體手中,對漂亮國來說是一個深刻的挑戰。我認為,問題在于漂亮國人民能否抵擋這種集中可能帶來的可能破壞民主的腐敗。否則,漂亮國人應該準備好成為數字主體,而不是人類公民。
了解更多時間深度剖析,盡在于此@黃先生斜杠青年
商業咨詢和顧問業務,請@yellowscholar
關注我,帶你先看到未來!?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.