非法野生動物貿(mào)易正成為生物多樣性面臨的最大威脅之一。它不僅威脅物種的生存,破壞生態(tài)平衡,還對公共衛(wèi)生安全構成風險。而互聯(lián)網(wǎng)憑借著其匿名性和便捷性,正在成為?法野?動物貿(mào)易的重要渠道。
國際愛護動物基?會(IFAW)長期致?于保護瀕危物種,努?遏制?法貿(mào)易。?2004年起,IFAW就開始關注互聯(lián)?上的?法野?動物貿(mào)易現(xiàn)象,并與執(zhí)法部門及互聯(lián)?企業(yè)合作,開展?絡野?動物犯罪相關研究,提供有關打擊?絡?法貿(mào)易的能?培訓,建??法野?動物貿(mào)易關鍵詞庫,舉辦野?動物保護主題公眾及?戶教育活動,團結各??量共同打擊?絡野?動物貿(mào)易。隨著互聯(lián)?監(jiān)管?度的加強,?法貿(mào)易者開始采取更為隱蔽的?段,不再在?告中提到物種名稱或者關鍵詞,?是僅使?圖?或者視頻?告來逃避監(jiān)測和屏蔽。因此使?傳統(tǒng)的關鍵詞檢索?式難以發(fā)現(xiàn)?法貿(mào)易信息,?單純使???在海量的?絡?告中鑒別野?動物制品,不僅準確率不?,?且需要耗費?量時間。
?法貿(mào)易者采用隱蔽?段進行廣告宣傳
為了應對這一挑戰(zhàn),IFAW與百度飛槳攜手,開發(fā)了利用人工智能技術打擊非法野生動物制品貿(mào)易的“瀕危物種AI守護官”1.0版。瀕危物種AI守護官”1.0版可以識別象、穿山甲、虎等三種野生動物的制品。野生動物制品的?法貿(mào)易是對瀕危物種的?要威脅,但此前市?上進?物種識別的AI?具主要是?于識別活體的野?動物,沒有能夠識野?動物制品的。這???是因為制品的訓練數(shù)據(jù)相?于活體更加難以獲得,另???也是由于制品的樣式實在過于多樣化,并且與??、塑料、?材等材質的制品外形?常類似。2023年,IFAW與百度再度合作,在飛槳的強大技術支持下,成功完成了“瀕危物種AI守護官”2.0版本的開發(fā)。2.0版本的守護官識別范圍擴大為9類野生動物制品和20種活體陸龜,識別準確度和速度也大大提升。
場景難點
在開發(fā)利???智能技術打擊?法野?動物制品貿(mào)易的“瀕危物種AI守護官”項?中,需要攻克的關鍵難點包括:
數(shù)據(jù)收集與標注難點:
非法野生動物制品的分類多,可供訓練的圖片量較少。
數(shù)據(jù)標注過程不僅需要?量人力成本,更需要專業(yè)知識和經(jīng)驗。
不同類別數(shù)據(jù)數(shù)量相差?,?關注類圖?較多,?野?動物制品類圖?較少。
- 圖像識別技術挑戰(zhàn):
- 野?動物制品的外觀差異?,形狀、紋理、顏?變化多樣,識別難度?。
- 野?動物制品可能與仿制品外形和紋理極其相似,即使專業(yè)?員也容易誤識別。
- 對于部分加?或雕刻后的制品,其原始特征可能被改變或遮擋,?導致難以識別。
- 快速推理要求:
- 需快速篩選出互聯(lián)?上的野?動物制品圖?,以減少?法交易的發(fā)?和擴散。
因此在搭建野?動物制品圖像分類系統(tǒng)時,技術上?臨著?個顯著的挑戰(zhàn):
1. 使?較少的數(shù)據(jù)訓練出準確且泛化能?強的野?動物制品識別模型。
2. 野?動物制品圖像分類系統(tǒng)在保證準確識別的同時,需要滿??效率推理的需求,以便快速在眾多圖?中識別出野?動物制品。
方案設計
該任務?共需要識別29類野?動物及其制品,但是需要同時區(qū)分野?動物的仿制品或者完全是?關注的類別,因為項目組希望模型可以忽略這些類別,?把真正野?動物及其制品的圖?召回并做分類。為了使?同?個模型解決這兩個問題,項目組將野?動物制品的仿制品和?關注的圖像融合為了第30類,所以這個任務被抽象為了?個30類的圖像分類任務。下圖中左圖為傳統(tǒng)上的兩階段解決思路,右圖為項目組的?案。
選擇好?案后,項目組使?了星河零代碼產(chǎn)線研發(fā)模型。星河零代碼產(chǎn)線集成了PaddleX的多種先進圖像分類模型,并提供了兩種適?于圖像分類的主要產(chǎn)線:通用圖像分類和?模型半監(jiān)督學習-圖像分類。鑒于野?動物制品的數(shù)據(jù)量較少、標注成本?和識別難度?,?模型半監(jiān)督學習圖像分類產(chǎn)線可以進?步調(diào)優(yōu)模型, 解決通?圖像分類在這些問題上的局限。同時,通過使?云端的V100多卡算?,項目組能夠以低成本和低門檻有效解決野?動物制品的識別難題。
模型選型:PaddleX 提供了 3 檔 9 種 SOTA 圖像分類模型,包含?精度模型、?效率模型、精度-效率均衡模型,具體模型如下表所示。
考慮到在該場景的模型需要滿?快速推理的需求,項目組根據(jù)提供的模型精度表選擇了?效率模型作為待選模型?案,在?效率的三個模型中, PP-LCNet_x1_0 效率更?,所以項目組將其作為了base迭代模型。
零代碼開發(fā)
數(shù)據(jù)校驗
在零代碼產(chǎn)線中?持數(shù)據(jù)劃分及數(shù)據(jù)校驗。經(jīng)過數(shù)據(jù)校驗項目組可以得到如下結果,包含了數(shù)據(jù)集在訓練集、驗證集抽樣的樣本帶標簽的可視化效果,以及數(shù)據(jù)集的樣本類別分布圖。
模型訓練/調(diào)優(yōu)
眾所周知,超參數(shù)對模型精度的影響?常?,星河零代碼產(chǎn)線將影響最?的?些超參數(shù)在前端展示了出來,?便?戶調(diào)試。配置好參數(shù)后,可?鍵提交訓練。
在這個過程中,項目組根據(jù)這個野?動物及制品的數(shù)據(jù)做了很多優(yōu)化,最終將模型的精度從80.3%優(yōu)化到了86.5%。
為了進?步提升模型的精度,項目組在此基礎上使?了星河零代碼產(chǎn)線的?模型半監(jiān)督學習-圖像分類產(chǎn)線, 最終模型精度為92.5%,較之前提升了6個百分點,達到了上線效果。該任務的?模型半監(jiān)督學習-圖像分類流程整體如下圖:
整個過程中的精度優(yōu)化結果如下圖所示:
模型部署與效果展示
星河零代碼產(chǎn)線打通了模型部署流程,可以選擇標記過的模型權重,?鍵部署為在線服務 API,不僅可以在其他聯(lián)?設備中調(diào)? API,也?持通過在線體驗應?單圖測試模型效果。
在線服務化部署頁面
服務調(diào)用方式
服務化部署測試效果
如需將模型部署到離線設備上,也可獲取離線部署包。根據(jù)其中的示例?檔即可在??的設備上實現(xiàn)快速部署。
用戶聲音
2020年,“瀕危物種AI守護官”1.0版正式上線以來,已累計協(xié)助篩查近36萬圖片信息,準確識別出21271幅目標非法野生動物制品圖片,促成7853條非法貿(mào)易廣告被刪除。這一工具幫助項目組鎖定了很多傳統(tǒng)方法無法發(fā)現(xiàn)的信息,大大提高了工作效率和準確性,更好的支持執(zhí)法和互聯(lián)網(wǎng)平臺監(jiān)管等相關工作。2024年“瀕危物種AI守護官”2.0版部署成功。希望升級后的守護官能幫助項目組識別更多非法野生動物貿(mào)易,在保護瀕危物種中發(fā)揮更重要的作用。
精彩課程預告
為了讓?伙伴們更快速地了解應?范例教程,百度研發(fā)?程師將于8?8?(周四)19:00為?家深度解析從數(shù)據(jù)準備、數(shù)據(jù)校驗、模型訓練、性能調(diào)優(yōu)到模型部署的開發(fā)全流程開發(fā)難點,從場景、產(chǎn)線、?具完成產(chǎn)業(yè)實操體驗。趕快掃描下?海報?維碼預約報名!
通?圖像分類產(chǎn)線在線體驗地址:
https://aistudio.baidu.com/community/app/100061
模型開發(fā)云端體驗地址:
https://aistudio.baidu.com/pipeline/mine
PaddleX開源本地版體驗地址:
https://github.com/PaddlePaddle/PaddleX
獲取更多技術內(nèi)容~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.