非法野生動物貿易正成為生物多樣性面臨的最大威脅之一。它不僅威脅物種的生存,破壞生態平衡,還對公共衛生安全構成風險。而互聯網憑借著其匿名性和便捷性,正在成為?法野?動物貿易的重要渠道。
國際愛護動物基?會(IFAW)長期致?于保護瀕危物種,努?遏制?法貿易。?2004年起,IFAW就開始關注互聯?上的?法野?動物貿易現象,并與執法部門及互聯?企業合作,開展?絡野?動物犯罪相關研究,提供有關打擊?絡?法貿易的能?培訓,建??法野?動物貿易關鍵詞庫,舉辦野?動物保護主題公眾及?戶教育活動,團結各??量共同打擊?絡野?動物貿易。隨著互聯?監管?度的加強,?法貿易者開始采取更為隱蔽的?段,不再在?告中提到物種名稱或者關鍵詞,?是僅使?圖?或者視頻?告來逃避監測和屏蔽。因此使?傳統的關鍵詞檢索?式難以發現?法貿易信息,?單純使???在海量的?絡?告中鑒別野?動物制品,不僅準確率不?,?且需要耗費?量時間。
?法貿易者采用隱蔽?段進行廣告宣傳
為了應對這一挑戰,IFAW與百度飛槳攜手,開發了利用人工智能技術打擊非法野生動物制品貿易的“瀕危物種AI守護官”1.0版。瀕危物種AI守護官”1.0版可以識別象、穿山甲、虎等三種野生動物的制品。野生動物制品的?法貿易是對瀕危物種的?要威脅,但此前市?上進?物種識別的AI?具主要是?于識別活體的野?動物,沒有能夠識野?動物制品的。這???是因為制品的訓練數據相?于活體更加難以獲得,另???也是由于制品的樣式實在過于多樣化,并且與??、塑料、?材等材質的制品外形?常類似。2023年,IFAW與百度再度合作,在飛槳的強大技術支持下,成功完成了“瀕危物種AI守護官”2.0版本的開發。2.0版本的守護官識別范圍擴大為9類野生動物制品和20種活體陸龜,識別準確度和速度也大大提升。
場景難點
在開發利???智能技術打擊?法野?動物制品貿易的“瀕危物種AI守護官”項?中,需要攻克的關鍵難點包括:
數據收集與標注難點:
非法野生動物制品的分類多,可供訓練的圖片量較少。
數據標注過程不僅需要?量人力成本,更需要專業知識和經驗。
不同類別數據數量相差?,?關注類圖?較多,?野?動物制品類圖?較少。
- 圖像識別技術挑戰:
- 野?動物制品的外觀差異?,形狀、紋理、顏?變化多樣,識別難度?。
- 野?動物制品可能與仿制品外形和紋理極其相似,即使專業?員也容易誤識別。
- 對于部分加?或雕刻后的制品,其原始特征可能被改變或遮擋,?導致難以識別。
- 快速推理要求:
- 需快速篩選出互聯?上的野?動物制品圖?,以減少?法交易的發?和擴散。
因此在搭建野?動物制品圖像分類系統時,技術上?臨著?個顯著的挑戰:
1. 使?較少的數據訓練出準確且泛化能?強的野?動物制品識別模型。
2. 野?動物制品圖像分類系統在保證準確識別的同時,需要滿??效率推理的需求,以便快速在眾多圖?中識別出野?動物制品。
方案設計
該任務?共需要識別29類野?動物及其制品,但是需要同時區分野?動物的仿制品或者完全是?關注的類別,因為項目組希望模型可以忽略這些類別,?把真正野?動物及其制品的圖?召回并做分類。為了使?同?個模型解決這兩個問題,項目組將野?動物制品的仿制品和?關注的圖像融合為了第30類,所以這個任務被抽象為了?個30類的圖像分類任務。下圖中左圖為傳統上的兩階段解決思路,右圖為項目組的?案。
選擇好?案后,項目組使?了星河零代碼產線研發模型。星河零代碼產線集成了PaddleX的多種先進圖像分類模型,并提供了兩種適?于圖像分類的主要產線:通用圖像分類和?模型半監督學習-圖像分類。鑒于野?動物制品的數據量較少、標注成本?和識別難度?,?模型半監督學習圖像分類產線可以進?步調優模型, 解決通?圖像分類在這些問題上的局限。同時,通過使?云端的V100多卡算?,項目組能夠以低成本和低門檻有效解決野?動物制品的識別難題。
模型選型:PaddleX 提供了 3 檔 9 種 SOTA 圖像分類模型,包含?精度模型、?效率模型、精度-效率均衡模型,具體模型如下表所示。
考慮到在該場景的模型需要滿?快速推理的需求,項目組根據提供的模型精度表選擇了?效率模型作為待選模型?案,在?效率的三個模型中, PP-LCNet_x1_0 效率更?,所以項目組將其作為了base迭代模型。
零代碼開發
數據校驗
在零代碼產線中?持數據劃分及數據校驗。經過數據校驗項目組可以得到如下結果,包含了數據集在訓練集、驗證集抽樣的樣本帶標簽的可視化效果,以及數據集的樣本類別分布圖。
模型訓練/調優
眾所周知,超參數對模型精度的影響?常?,星河零代碼產線將影響最?的?些超參數在前端展示了出來,?便?戶調試。配置好參數后,可?鍵提交訓練。
在這個過程中,項目組根據這個野?動物及制品的數據做了很多優化,最終將模型的精度從80.3%優化到了86.5%。
為了進?步提升模型的精度,項目組在此基礎上使?了星河零代碼產線的?模型半監督學習-圖像分類產線, 最終模型精度為92.5%,較之前提升了6個百分點,達到了上線效果。該任務的?模型半監督學習-圖像分類流程整體如下圖:
整個過程中的精度優化結果如下圖所示:
模型部署與效果展示
星河零代碼產線打通了模型部署流程,可以選擇標記過的模型權重,?鍵部署為在線服務 API,不僅可以在其他聯?設備中調? API,也?持通過在線體驗應?單圖測試模型效果。
在線服務化部署頁面
服務調用方式
服務化部署測試效果
如需將模型部署到離線設備上,也可獲取離線部署包。根據其中的示例?檔即可在??的設備上實現快速部署。
用戶聲音
2020年,“瀕危物種AI守護官”1.0版正式上線以來,已累計協助篩查近36萬圖片信息,準確識別出21271幅目標非法野生動物制品圖片,促成7853條非法貿易廣告被刪除。這一工具幫助項目組鎖定了很多傳統方法無法發現的信息,大大提高了工作效率和準確性,更好的支持執法和互聯網平臺監管等相關工作。2024年“瀕危物種AI守護官”2.0版部署成功。希望升級后的守護官能幫助項目組識別更多非法野生動物貿易,在保護瀕危物種中發揮更重要的作用。
精彩課程預告
為了讓?伙伴們更快速地了解應?范例教程,百度研發?程師將于8?8?(周四)19:00為?家深度解析從數據準備、數據校驗、模型訓練、性能調優到模型部署的開發全流程開發難點,從場景、產線、?具完成產業實操體驗。趕快掃描下?海報?維碼預約報名!
通?圖像分類產線在線體驗地址:
https://aistudio.baidu.com/community/app/100061
模型開發云端體驗地址:
https://aistudio.baidu.com/pipeline/mine
PaddleX開源本地版體驗地址:
https://github.com/PaddlePaddle/PaddleX
獲取更多技術內容~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.