99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

小紅書等給AI圖像檢測上難度!數據集均通過人類感知“圖靈測試”

0
分享至

小紅書團隊 投稿至 凹非寺
量子位 | 公眾號 QbitAI

AI生成內容已深度滲透至生活的方方面面,從藝術創作到設計領域,再到信息傳播與版權保護,其影響力無處不在。

然而,隨著生成模型技術的飛速發展,如何精準甄別AI生成圖像成為業界與學界共同聚焦的難題。

來自小紅書生態算法團隊、中科大、上海交通大學聯合提出行業稀缺的全人工標注Chameleon基準和行業領先的AIDE檢測方法。



團隊經過分析,幾乎所有模型都將Chameleon基準中AI生成的圖像歸類為真實圖像

于是他們提出了AIDE(具有混合特征的AI -generated Image DE tector ),它利用多個專家同時提取視覺偽影和噪聲模式。最終分別比現有的最先進方法提高了 3.5% 和 4.6% 的準確率。

重新定義AI生成圖像檢測任務

Train-Test Setting-I:在現有研究中,AI 生成圖像檢測任務通常被設定為在一個特定的生成模型(如 GAN 或擴散模型)上訓練模型,然后在其他生成模型上進行測試。

然而,通常來說,這種設定存在兩個主要問題:

評估Benchmark過于簡單:現有Benchmark中的圖像通常會有一些artifacts。

訓練數據的局限性:將模型限制在特定類型的生成模型上 (GAN or 擴散模型) 訓練,限制了模型從更先進的生成模型中學習多樣化特征的能力。

為了解決這些問題,團隊提出了一個新的問題設定:

Train-Test Setting-II:鑒別器可以將多種生成模型的圖像混合一起訓練,然后在更具挑戰性的、真實世界場景中的圖像上進行測試。這種設定更符合實際應用中的需求,能夠更好地評估模型的泛化能力和魯棒性。

為了更真實地評估 AI 生成圖像檢測方法的性能,團隊精心構建了Chameleon 數據集。



Chameleon數據集具有以下顯著特點:

高度逼真性:所有AI生成圖像均通過了人類感知“圖靈測試”,即人類標注者無法將其與真實圖像區分開來。這些圖像在視覺上與真實圖像高度相似,能夠有效挑戰現有檢測模型的極限。

多樣化類別:數據集涵蓋了人類、動物、物體和場景等多類圖像,全面模擬現實世界中的各類場景。這種多樣性確保了模型在不同類別上的泛化能力。

高分辨率:圖像分辨率普遍超過720P,最高可達4K。高分辨率圖像不僅提供了更豐富的細節信息,也增加了檢測模型對細微差異的捕捉能力。

數據集構建

為構建一個能夠真實反映 AI 生成圖像檢測挑戰的高質量數據集,團隊在數據收集、清洗和標注環節均采取了創新且嚴謹的方法,確保數據集的高質量和高逼真度。

數據收集:多渠道、高逼真度圖像獲取

與之前的基準數據集不同,團隊從多個流行的 AI 繪畫社區(如 ArtStation、Civitai 和 Liblib)收集了超過 150K 的 AI 生成圖像,這些圖像均由廣泛的用戶創作,使用了多種先進的生成模型(如 Midjourney、DALL·E 3 和 Stable Diffusion 等)。這些圖像不僅在視覺上逼真,而且涵蓋了豐富多樣的主題和風格,包括人物、動物、物體和場景等。此外,還從 Unsplash 等平臺收集了超過 20K 的真實圖像,這些圖像均由專業攝影師拍攝,具有高分辨率和高質量。所有圖像均獲得了合法授權,確保了數據的合法性和可用性。

相比之下,之前的基準數據集通常使用生成效果較差的模型生成圖像,缺乏多樣性和真實感,如下圖所示。



數據清洗:多維度、精細化過濾

為確保數據集的高質量,團隊對收集的圖像進行了多維度、精細化的清洗過程:

分辨率過濾:團隊過濾掉了分辨率低于 448×448 的圖像,確保所有圖像具有足夠的細節和清晰度,以反映 AI 生成圖像的真實特性。

內容過濾:利用先進的安全檢查模型(如 Stable Diffusion 的安全檢查模型),團隊過濾掉了包含暴力、色情和其他不適宜內容的圖像,確保數據集的合規性和適用性。

去重處理:通過比較圖像的哈希值,團隊去除了重復的圖像,確保數據集的多樣性和獨立性。

文本-圖像一致性過濾:利用 CLIP 模型,團隊計算了圖像與對應文本描述的相似度,過濾掉了與文本描述不匹配的圖像,確保圖像與文本的一致性和相關性。

之前的基準數據集往往缺乏嚴格的過濾步驟,導致數據集中包含大量低質量、不適宜或重復的圖像,影響了數據集的整體質量。

數據標注:專業標注平臺與多輪評估

為確保數據集的準確性和可靠性,團隊建立了專門的標注平臺,并招募了 20 名具有豐富經驗的人類標注者對圖像進行分類和真實性評估:

分類標注:標注者將圖像分為人類、動物、物體和場景四類,確保數據集覆蓋了多種現實世界中的場景和對象。

真實性評估:標注者根據“是否可以用相機拍攝”這一標準對圖像的真實性進行評估。每個圖像獨立評估兩次,只有當兩名標注者均誤判為真實時,圖像才被標記為“高逼真”。

多輪評估:為確保標注的準確性,團隊對標注結果進行了多輪審核和校對,確保每個圖像的分類和真實性評估結果準確無誤。

與之前的基準數據集不同,該數據集經過了嚴格的人工標注,確保了數據集的高質量和高逼真度。之前的基準數據集往往缺乏嚴格的人工標注,導致數據集中的圖像質量和標注準確性參差不齊。

通過上述多維度、精細化的數據收集、清洗和標注過程,構建了一個高質量、高逼真度的 AI 生成圖像檢測基準數據集,為后續的研究和模型評估提供了堅實的基礎。該數據集不僅在規模上更大,而且在圖像質量和標注精度上也有了顯著提升,能夠更好地反映 AI 生成圖像檢測的實際挑戰。

數據集對比

Chameleon數據集可以作為現有評測數據集的擴展,Chameleon數據集在規模、多樣性和圖像質量等方面均展現出顯著優勢:

規模:Chameleon數據集包含約26,000張測試圖像,是目前最大的AI生成圖像檢測數據集之一。

多樣性:數據集涵蓋了多種生成模型和圖像類別,遠超其他數據集的單一類別。

圖像質量:圖像分辨率從720P到4K不等,提供了更高質量的圖像數據,增加了檢測模型的挑戰性。

AIDE模型:多專家融合的檢測框架

在AI生成圖像檢測領域,現有的檢測方法往往只能從單一角度進行分析,難以全面捕捉AI生成圖像與真實圖像之間的細微差異。

為了解決這一問題,研究者們提出了簡單且有效的AIDE(AI-generated Image DEtector with Hybrid Features)模型,該模型通過融合多種專家模塊,從低級像素統計和高級語義兩個層面全面捕捉圖像特征,實現了對AI生成圖像的精準檢測。

AIDE模型主要由兩個核心模塊組成:Patchwise Feature Extraction(PFE)模塊和Semantic Feature Embedding(SFE)模塊。這兩個模塊通過多專家融合的方式,共同為最終的分類決策提供豐富的特征信息。



Patchwise Feature Extraction(PFE)模塊

PFE模塊旨在捕捉圖像中的低級像素統計特征,特別是AI生成圖像中常見的噪聲模式和紋理異常。具體而言,該模塊通過以下步驟實現:

Patch Selection via DCT Scoring:首先,將輸入圖像劃分為多個固定大小的圖像塊(如32×32像素)。然后,對每個圖像塊應用離散余弦變換(DCT),將其轉換到頻域。通過設計不同的帶通濾波器,計算每個圖像塊的頻率復雜度得分,從而識別出最高頻率和最低頻率的圖像塊。

Patchwise Feature Encoder:將篩選出的高頻和低頻圖像塊調整為統一大小(如256×256像素),并輸入到SRM(Spatial Rich Model)濾波器中提取噪聲模式特征。這些特征隨后通過兩個ResNet-50網絡進行進一步處理,得到最終的特征圖。

Semantic Feature Embedding(SFE)模塊

SFE模塊旨在捕捉圖像中的高級語義特征,特別是物體共現和上下文關系等。具體而言,該模塊通過以下步驟實現:

Semantic Feature Embedding:利用預訓練的OpenCLIP模型對輸入圖像進行全局語義編碼,得到圖像的視覺嵌入特征。通過添加線性投影層和平均空間池化操作,進一步提取圖像的全局上下文信息。

Discriminator模塊

將PFE和SFE模塊提取的特征在通道維度上進行融合,通過多層感知機(MLP)進行最終的分類預測。具體而言,首先對高頻和低頻特征圖進行平均池化,得到低級特征表示;然后將其與高級語義特征進行通道級拼接,形成最終的特征向量;最后通過MLP網絡輸出分類結果。

實驗結果

數據集:實驗在AIGCDetectBenchmark、GenImage和Chameleon三個數據集上進行。AIGCDetectBenchmark和GenImage是現有的基準測試數據集,而Chameleon是研究者們新構建的更具挑戰性的數據集。

模型對比:研究者選擇了9種現成的AI生成圖像檢測器進行對比,包括CNNSpot、FreDect、Fusing、LNP、LGrad、UnivFD、DIRE、PatchCraft和NPR。

評價指標:實驗采用分類準確率(Accuracy)和平均精度(Average Precision, AP)作為評價指標。

團隊評測了AIDE在AIGCDetectBenchmark和GenImage上的結果,如下表所示:



AIDE模型在這兩個數據集上的優異表現表明,融合低級像素統計和高級語義特征的方法能夠有效捕捉AI生成圖像與真實圖像之間的差異,從而提高檢測準確率。

隨后在Chameleon benchmark上測評了9個現有的detectors,如下表所示。



同時團隊可視化了,之前的SOTA方法PatchCraft在AIGCDetectBenchmark & GenImage 以及Chameleon上的表現



結果表明,之前在AIGCDetectBenchmark &GenImage上表現優異的模型,在Chameleon benchmark上均表現很差,這表明Chameleon數據集中的圖像確實具有高度的逼真性,對現有檢測模型提出了更大的挑戰。

本論文通過對現有 AI 生成圖像檢測方法的重新審視,提出了一個新的問題設定,構建了更具挑戰性的 Chameleon 數據集,并設計了一個融合多專家特征的檢測器 AIDE。實驗結果表明,AIDE 在現有的兩個流行基準(AIGCDetectBenchmark 和 GenImage)上取得了顯著的性能提升,分別比現有的最先進方法提高了 3.5% 和 4.6% 的準確率。然而,在 Chameleon 基準上,盡管 AIDE 取得了最好的性能,但與現有基準相比,仍存在較大的差距。

這表明,檢測 AI 生成圖像的任務仍然具有很大的挑戰性,需要未來進一步的研究和改進。希望這一工作能夠為這一領域的研究提供新的思路和方向,推動 AI 生成圖像檢測技術的發展。

盡管AIDE模型在AI生成圖像檢測領域取得了顯著進展,但研究者們仍計劃在未來的工作中進一步優化模型架構,探索更高效的特征提取和融合方法。

此外,研究者們還計劃擴大Chameleon數據集的規模,涵蓋更多類別、更多場景、更多生成模型的圖像,以推動AI生成圖像檢測技術的進一步發展。

論文:https://arxiv.org/pdf/2406.19435
主頁:https://shilinyan99.github.io/AIDE/
代碼:https://github.com/shilinyan99/AIDE

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
潛伏在中國的反華家族,靠大陸收入上億,今國家出手下場大快人心

潛伏在中國的反華家族,靠大陸收入上億,今國家出手下場大快人心

紅色鑒史官
2025-06-16 20:30:03
原陸軍中將尤海濤被查處,系開國少將尤太忠之子,他讓父輩蒙羞

原陸軍中將尤海濤被查處,系開國少將尤太忠之子,他讓父輩蒙羞

揚平說史
2025-01-03 21:10:50
以軍變本加厲,伊朗新司令,僅上臺96小時就殉國

以軍變本加厲,伊朗新司令,僅上臺96小時就殉國

科技有趣事
2025-06-18 11:56:28
11億黃金級肉簽公布中簽號碼,中簽人數較多,股民中得即賺到!

11億黃金級肉簽公布中簽號碼,中簽人數較多,股民中得即賺到!

數據挖掘分析
2025-06-18 13:15:10
伊朗要上大蘑菇?今發布“最后通牒”,警告以色列民眾盡快逃命!

伊朗要上大蘑菇?今發布“最后通牒”,警告以色列民眾盡快逃命!

陳博世財經
2025-06-17 10:23:11
中年女人允許曖昧,卻又不讓你碰,大多是以下三個原因

中年女人允許曖昧,卻又不讓你碰,大多是以下三個原因

葉飛飛情感屋
2025-06-18 18:45:33
“91大神”唐哥:拍攝22部視頻,非法獲利400萬,內容不堪入目

“91大神”唐哥:拍攝22部視頻,非法獲利400萬,內容不堪入目

就一點
2025-06-16 16:48:18
茍坪卸任國務院國資委副主任,已任中國星網集團董事長

茍坪卸任國務院國資委副主任,已任中國星網集團董事長

澎湃新聞
2025-06-18 13:12:27
剛剛,安徽一廳級“內鬼”被查

剛剛,安徽一廳級“內鬼”被查

魯中晨報
2025-06-18 17:34:03
清華美女學霸走紅后續:父親不讓其直播,本人回應已和父親鬧掰

清華美女學霸走紅后續:父親不讓其直播,本人回應已和父親鬧掰

不寫散文詩
2025-06-18 16:22:10
無論登貝萊還是亞馬爾拿到金球獎,都將恢復05年延續至今的傳統

無論登貝萊還是亞馬爾拿到金球獎,都將恢復05年延續至今的傳統

體育一點就通
2025-06-18 11:31:09
28歲小伙龍泉山遇難后續!最后畫面曝光,知情人稱被野豬吃了一半

28歲小伙龍泉山遇難后續!最后畫面曝光,知情人稱被野豬吃了一半

壹月情感
2025-06-17 22:14:18
3:2!日本女排顏面掃地,險被亞洲魚腩爆冷,中國隊要有危機感

3:2!日本女排顏面掃地,險被亞洲魚腩爆冷,中國隊要有危機感

跑者排球視角
2025-06-18 20:00:51
老毛病又犯了!馬克龍再次和女嘉賓眉來眼去,布里吉特悔之晚矣

老毛病又犯了!馬克龍再次和女嘉賓眉來眼去,布里吉特悔之晚矣

小嵩
2025-06-18 11:45:05
多個省年輕干部前往新疆任職

多個省年輕干部前往新疆任職

魯中晨報
2025-06-18 18:42:06
36D“奶糖妹妹”私照公開,發育過猛了,這是不打碼能看的?

36D“奶糖妹妹”私照公開,發育過猛了,這是不打碼能看的?

健身迷
2025-06-14 09:37:06
每年70萬人因肺癌而死!再次勸告:天熱寧可吹吹風扇,也別做6事

每年70萬人因肺癌而死!再次勸告:天熱寧可吹吹風扇,也別做6事

嘆為觀止易
2025-06-17 11:44:21
京東集團CEO許冉首次揭秘外賣員收入:北上廣深等一線城市,京東全職外賣騎手的人均月收入已經接近了1.3萬元

京東集團CEO許冉首次揭秘外賣員收入:北上廣深等一線城市,京東全職外賣騎手的人均月收入已經接近了1.3萬元

和訊網
2025-06-18 09:17:30
汪東興晚年懊悔:我當年怎么就瞎了眼,推薦了這樣一個人給毛主席

汪東興晚年懊悔:我當年怎么就瞎了眼,推薦了這樣一個人給毛主席

方圓文史
2023-10-23 19:32:54
特朗普騎虎難下,美若對伊朗動武,或將為中國提供新一輪戰略機遇

特朗普騎虎難下,美若對伊朗動武,或將為中國提供新一輪戰略機遇

博覽歷史
2025-06-17 11:35:30
2025-06-18 22:24:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10692文章數 176169關注度
往期回顧 全部

科技要聞

別叫我互聯網公司,京東的野心藏不住了

頭條要聞

廣東懷集出現55.22米洪峰水位 洪水已漫入周邊居民樓

頭條要聞

廣東懷集出現55.22米洪峰水位 洪水已漫入周邊居民樓

體育要聞

高僧下山了!文班結束少林寺10日修行

娛樂要聞

前老板舉報李雪琴欠190萬轉移公司財產

財經要聞

被爆添加毒原料后相宜本草高管先后出走

汽車要聞

燈光技術升級還有插混版本 全新奧迪Q3預計明年國產

態度原創

家居
房產
健康
公開課
軍事航空

家居要聞

溫暖明亮 三代同堂之家

房產要聞

創紀錄了!海南單日賣地44億!保利、方大瘋狂出手!

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普呼吁伊朗無條件投降

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 武清区| 广元市| 通道| 澄城县| 万山特区| 清水县| 饶平县| 博爱县| 汉源县| 昂仁县| 尉犁县| 乐昌市| 麦盖提县| 云霄县| 南川市| 财经| 衡东县| 林芝县| 盐津县| 视频| 本溪| 高陵县| 嘉祥县| 日土县| 宁强县| 涟水县| 松江区| 鄱阳县| 桐乡市| 松溪县| 镇坪县| 普安县| 株洲县| 莲花县| 上蔡县| 嘉义县| 柳林县| 双鸭山市| 涟水县| 洛宁县| 广安市|