99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一文帶你讀懂YOLOv1~YOLOv11

0
分享至

來源:OpenCV與AI深度學(xué)習(xí)


YOLO (You Only Look Once) 是一系列實(shí)時(shí)對(duì)象檢測(cè)機(jī)器學(xué)習(xí)算法。對(duì)象檢測(cè)是一項(xiàng)計(jì)算機(jī)視覺任務(wù),它使用神經(jīng)網(wǎng)絡(luò)對(duì)圖像中的對(duì)象進(jìn)行定位和分類。這項(xiàng)任務(wù)的應(yīng)用范圍很廣,從醫(yī)學(xué)成像到自動(dòng)駕駛汽車。多種機(jī)器學(xué)習(xí)算法用于對(duì)象檢測(cè),其中一種是卷積神經(jīng)網(wǎng)絡(luò) (CNN)。

CNN 是任何 YOLO 模型的基礎(chǔ),研究人員和工程師使用這些模型執(zhí)行對(duì)象檢測(cè)和分割等任務(wù)。YOLO 模型是開源的,它們?cè)谠擃I(lǐng)域得到了廣泛的應(yīng)用。這些模型從一個(gè)版本到另一個(gè)版本都在改進(jìn),從而提高了準(zhǔn)確性、性能和附加功能。本文將探討整個(gè) YOLO 家族,我們將從原始到最新開始,探索它們的架構(gòu)、用例和演示。

YOLOv1

在引入 YOLO 對(duì)象檢測(cè)之前,研究人員使用了基于卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的方法,如 R-CNN 和 Fast R-CNN。這些方法使用兩步過程來預(yù)測(cè)邊界框,然后使用回歸對(duì)這些框中的對(duì)象進(jìn)行分類。這種方法速度緩慢且占用大量資源,但 YOLO 模型徹底改變了對(duì)象檢測(cè)。當(dāng) Joseph Redmon 和 Ali Farhadi 于 2016 年開發(fā)第一個(gè) YOLO 時(shí),它通過新的增強(qiáng)架構(gòu)克服了傳統(tǒng)對(duì)象檢測(cè)算法的大部分問題。


最初的 YOLO 架構(gòu)由 24 個(gè)卷積層和 2 個(gè)完全連接的層組成,其靈感來自用于圖像分類的 GoogLeNet 模型。YOLOv1 方法在當(dāng)時(shí)是第一個(gè)。

網(wǎng)絡(luò)的初始卷積層從圖像中提取特征,而全連接層預(yù)測(cè)輸出概率和坐標(biāo)。這意味著邊界框和分類都在一個(gè)步驟中進(jìn)行。這個(gè)一步式流程簡(jiǎn)化了操作并實(shí)現(xiàn)了實(shí)時(shí)效率。此外,YOLO 體系結(jié)構(gòu)還使用了以下優(yōu)化技術(shù)。

  • Leaky ReLU 激活:Leaky ReLU 有助于防止“垂死的 ReLU”問題,即神經(jīng)元在訓(xùn)練過程中可能會(huì)卡在不活躍的狀態(tài)。

  • Dropout 正則化:YOLOv1 在第一個(gè)全連接層之后應(yīng)用 dropout 正則化,以防止過擬合。

  • 數(shù)據(jù)增強(qiáng)

如何工作的?

YOLO 模型的本質(zhì)是將對(duì)象檢測(cè)視為回歸問題。YOLO 方法是將單個(gè)卷積神經(jīng)網(wǎng)絡(luò) (CNN) 應(yīng)用于完整圖像。此網(wǎng)絡(luò)將圖像劃分為多個(gè)區(qū)域,并預(yù)測(cè)每個(gè)區(qū)域的邊界框和概率。

這些邊界框由預(yù)測(cè)概率加權(quán)。然后,可以對(duì)這些權(quán)重進(jìn)行閾值處理,以僅顯示高分檢測(cè)。


YOLOv1 將輸入圖像劃分為一個(gè)網(wǎng)格 (SxS),每個(gè)網(wǎng)格單元負(fù)責(zé)預(yù)測(cè)其內(nèi)部對(duì)象的邊界框和類概率。每個(gè)邊界框預(yù)測(cè)都包含一個(gè)置信度分?jǐn)?shù),指示框中存在對(duì)象的可能性。研究人員使用交并比 (IOU) 等技術(shù)計(jì)算置信度分?jǐn)?shù),該技術(shù)可用于篩選預(yù)測(cè)。盡管 YOLO 方法新穎且速度很快,但它面臨一些限制,如下所示。

  • 泛化:YOLOv1 難以檢測(cè)在訓(xùn)練中無法準(zhǔn)確看到的新對(duì)象。

  • 空間約束:在 YOLOv1 中,每個(gè)網(wǎng)格單元格只能預(yù)測(cè)兩個(gè)框,并且只能有一個(gè)類,這使得它難以處理成群出現(xiàn)的小對(duì)象,例如鳥群。

  • 損失函數(shù)限制:YOLOv1 損失函數(shù)在小邊界框和大邊界框中處理錯(cuò)誤的方式相同。大框中的小錯(cuò)誤通常是可以的,但小錯(cuò)誤對(duì) IOU 的影響要大得多。

  • 定位錯(cuò)誤:YOLOv1 的一個(gè)主要問題是準(zhǔn)確性,它經(jīng)常錯(cuò)誤地定位對(duì)象在圖像中的位置。

現(xiàn)在我們已經(jīng)介紹了 YOLO 的基本機(jī)制,讓我們看看研究人員如何在下一個(gè)版本中升級(jí)此模型的功能。

YOLOv2

YOLO9000在 YOLOv1 發(fā)布一年后推出,以解決當(dāng)時(shí)對(duì)象檢測(cè)數(shù)據(jù)集的局限性。YOLO9000之所以這樣命名,是因?yàn)樗梢詸z測(cè) 9000 多個(gè)不同的對(duì)象類別。這在準(zhǔn)確性和泛化性方面具有變革性。

YOLO9000 背后的研究人員提出了一種獨(dú)特的聯(lián)合訓(xùn)練算法,該算法可以根據(jù)檢測(cè)和分類數(shù)據(jù)訓(xùn)練對(duì)象檢測(cè)器。這種方法利用標(biāo)記的檢測(cè)圖像來學(xué)習(xí)精確定位對(duì)象,并使用分類圖像來增加其詞匯量和魯棒性。


通過組合來自不同數(shù)據(jù)集的特征進(jìn)行分類和檢測(cè),YOLO9000 顯示出比其前身 YOLOv1 有很大的改進(jìn)。YOLO9000 被宣布為更好、更強(qiáng)、更快。

  • 分層分類:YOLO9000 中使用的一種基于 WordTree 結(jié)構(gòu)的方法,允許增加對(duì)看不見對(duì)象的泛化,并增加對(duì)象的詞匯量或范圍。

  • 架構(gòu)變化:YOLO9000引入了一些變化,例如使用批量規(guī)范化來加快訓(xùn)練和穩(wěn)定性、使用錨框或滑動(dòng)窗口方法,并使用 Darknet-19 作為主干。Darknet-19 是一個(gè)具有 19 層的 CNN,旨在準(zhǔn)確和快速。

  • 聯(lián)合訓(xùn)練:一種算法,允許模型利用分層分類框架并從分類和檢測(cè)數(shù)據(jù)集(如 COCO 和 ImageNet)中學(xué)習(xí)。

不過,YOLO 系列繼續(xù)改進(jìn),接下來我們來看看 YOLOv3。

YOLOv3

幾年后,YOLO 背后的研究人員提出了下一個(gè)版本 YOLOv3。雖然 YOLO9000 是一種最先進(jìn)的模型,但對(duì)象檢測(cè)通常有其局限性。提高準(zhǔn)確性和速度始終是對(duì)象檢測(cè)模型的目標(biāo)之一,這也是 YOLOv3 的目標(biāo),在這里和那里進(jìn)行少量調(diào)整,我們就會(huì)得到性能更好的模型。

改進(jìn)從邊界框開始,雖然它仍然使用滑動(dòng)窗口方法,但 YOLOv3 有一些增強(qiáng)。YOLOv3 引入了多尺度預(yù)測(cè),它可以在三種不同尺度上預(yù)測(cè)邊界框。這意味著可以更有效地檢測(cè)不同大小的物體。除其他改進(jìn)外,這讓 YOLO 重新回到了最先進(jìn)模型的地圖上,并在速度和準(zhǔn)確性之間進(jìn)行了權(quán)衡。


如圖所示,YOLOv3 使用平均精度均值 (mAP-50) 指標(biāo)提供了最佳的速度和準(zhǔn)確性之一。此外,YOLOv3 還引入了其他改進(jìn),如下所示。

  • 骨干網(wǎng):YOLOv3 使用更好、更大的 CNN 骨干網(wǎng),即 Darknet-53,它由 53 層組成,是 Darknet-19 和深度學(xué)習(xí)殘差網(wǎng)絡(luò) (Resnets) 之間的混合方法,但比 ResNet-101 或 ResNet-152 更高效。

  • 跨尺度預(yù)測(cè):YOLOv3 預(yù)測(cè)三種不同尺度的邊界框,類似于特征金字塔網(wǎng)絡(luò)。這使模型能夠更有效地檢測(cè)各種大小的對(duì)象。

  • 分類器:使用獨(dú)立的 Logistic 分類器代替 softmax 函數(shù),允許每個(gè)盒子有多個(gè)標(biāo)簽。

  • 數(shù)據(jù)集:研究人員僅在 COCO 數(shù)據(jù)集上訓(xùn)練 YOLOv3。

此外,雖然不太重要,但 YOLOv3 修復(fù)了 YOLOv2 中的一個(gè)小數(shù)據(jù)加載錯(cuò)誤,這幫助了大約 2 mAP 點(diǎn)。接下來,讓我們看看 YOLO 模型是如何演變成 YOLOv4 的。

YOLOv4

延續(xù) YOLO 系列的傳統(tǒng),YOLOv4 引入了多項(xiàng)改進(jìn)和優(yōu)化。讓我們更深入地了解 YOLOv4 機(jī)制。

結(jié)構(gòu)

最顯著的變化是 3 部分架構(gòu),雖然 YOLOv4 仍然是一個(gè)單階段的目標(biāo)檢測(cè)網(wǎng)絡(luò),但架構(gòu)涉及 3 個(gè)主要組件,即 backbone、head 和 neck。這種架構(gòu)拆分是 YOLO 發(fā)展過程中非常重要的一步。在 YOLO 中,backbone、head 和 neck 都有自己的功能。

主干是特征提取部分,通常是跨層學(xué)習(xí)特征的 CNN。然后,neck 對(duì)從 backbone 的不同級(jí)別提取的特征進(jìn)行細(xì)化和組合,從而創(chuàng)建豐富且信息豐富的特征表示。最后,head 執(zhí)行實(shí)際預(yù)測(cè),并輸出邊界框、類概率和對(duì)象性分?jǐn)?shù)。


對(duì)于 YOLOv4,研究人員將以下組件用于 backbone、neck 和 head。

  • 主干網(wǎng):CSPDarknet53 是一個(gè)卷積神經(jīng)網(wǎng)絡(luò)和對(duì)象檢測(cè)主干網(wǎng),它使用使用跨階段部分網(wǎng)絡(luò) (CSPNet) 策略的 DarkNet-53。

  • Neck:修改后的空間金字塔池化 (SPP) 和路徑聚合網(wǎng)絡(luò) (PAN) 用于 YOLOv4,從而產(chǎn)生更精細(xì)的特征提取、更好的訓(xùn)練和更好的性能。

  • 頭部:YOLOv4 采用 YOLOv3 的(基于錨點(diǎn)的)架構(gòu)作為 YOLOv4 的頭部。

這并不是 YOLOv4 引入的全部,在優(yōu)化和選擇正確的方法和技術(shù)方面還有很多工作,讓我們接下來探索這些。

優(yōu)化

正如研究人員在論文中介紹的那樣,YOLOv4 模型帶有兩袋方法:免費(fèi)贈(zèng)品袋 (BoF) 和特價(jià)袋 (BoS)。這些方法對(duì) YOLOv4 的性能很有幫助,在本節(jié)中,我們將探討研究人員使用的重要方法。

  • 馬賽克數(shù)據(jù)增強(qiáng):這種數(shù)據(jù)增強(qiáng)方法將 4 張訓(xùn)練圖像合二為一,使模型能夠?qū)W習(xí)在更廣泛的上下文中檢測(cè)對(duì)象,并減少對(duì)大小批量的需求。研究人員將其用作骨干訓(xùn)練的 BoF 的一部分。

  • 自我對(duì)抗訓(xùn)練 (SAT):一種兩階段數(shù)據(jù)增強(qiáng)技術(shù),其中網(wǎng)絡(luò)欺騙自己并修改輸入圖像以認(rèn)為沒有對(duì)象。然后,它在這個(gè)修改后的圖像上進(jìn)行訓(xùn)練,以提高穩(wěn)健性和泛化性。研究人員將其用作檢測(cè)器或網(wǎng)絡(luò)頭的 BoF 的一部分。

  • 跨小批量歸一化 (CmBN):交叉迭代批量歸一化 (CBN) 的修改版,使訓(xùn)練更適合單個(gè) GPU。研究人員用作探測(cè)器 BoF 的一部分。

  • 改進(jìn)的空間注意力模塊 (SAM):研究人員將原始 SAM 從空間注意力修改為點(diǎn)注意力,增強(qiáng)了模型在不增加計(jì)算成本的情況下專注于重要特征的能力。用作 BoS 的一部分,作為網(wǎng)絡(luò)檢測(cè)器的附加塊。

然而,這還不是全部,YOLOv4 在 BoS 和 BoF 中使用了許多其他技術(shù),例如作為 BoS 一部分的骨干網(wǎng)的 Mish 激活和跨級(jí)部分連接 (CSP)。所有這些優(yōu)化修改為 YOLOv4 帶來了最先進(jìn)的性能,尤其是在速度和準(zhǔn)確性方面。


YOLOv5

雖然 YOLOv5 沒有附帶專門的研究論文,但該模型給所有開發(fā)人員、工程師和研究人員留下了深刻的印象。YOLOv5 在 YOLOv4 之后幾個(gè)月推出,沒有太大的改進(jìn),但速度略快。Ultralytics 設(shè)計(jì)的 YOLOv5 更易于實(shí)現(xiàn),并且具有多種語言支持的更詳細(xì)的文檔,最值得注意的是 YOLOv5 基于 Pytorch 構(gòu)建,使其易于開發(fā)人員使用。

與此同時(shí),它的前輩稍微難以實(shí)現(xiàn)。Ultralytics 宣布 YOLOv5 為世界上最受歡迎的視覺 AI,此外,YOLOv5 還具有一些很棒的功能,例如用于模型導(dǎo)出的不同格式、用于使用您自己的數(shù)據(jù)進(jìn)行訓(xùn)練的訓(xùn)練腳本,以及多種訓(xùn)練技巧,如測(cè)試時(shí)增強(qiáng) (TTA) 和模型集成。



易用性、持續(xù)更新、龐大的社區(qū)和良好的文檔使 YOLOv5 成為完美的緊湊型模型,它可以在輕量級(jí)硬件上運(yùn)行,并且?guī)缀鯇?shí)時(shí)地提供不錯(cuò)的準(zhǔn)確性。YOLO 模型在 YOLOv5 到 YOLOv6 之后繼續(xù)發(fā)展,讓我們?cè)谙乱还?jié)中探討一下。

YOLOv6

YOLOv6 是 YOLO 系列中的一次重大演變,它引入了一些關(guān)鍵的架構(gòu)和訓(xùn)練變化,以實(shí)現(xiàn)速度和準(zhǔn)確性之間的更好平衡。值得注意的是,YOLOv6 以專注于工業(yè)應(yīng)用而著稱。這種工業(yè)重點(diǎn)提供了部署就緒型網(wǎng)絡(luò),并更好地考慮了實(shí)際環(huán)境的約束。

在速度和準(zhǔn)確性之間取得平衡,它可以在常用硬件上運(yùn)行,例如 Tesla T4 GPU,這使得在工業(yè)環(huán)境中部署對(duì)象檢測(cè)比以往任何時(shí)候都更容易。YOLOv6 并不是當(dāng)時(shí)唯一可用的模型,還有 YOLOv5、YOLOX 和 YOLOv7 都是高效探測(cè)器部署的競(jìng)爭(zhēng)候選者。現(xiàn)在,讓我們討論一下 YOLOv6 引入的變化。


  • Backbone:研究人員使用 EfficientRep 構(gòu)建主干,EfficientRep 是一種硬件感知型 CNN,具有用于小型模型(N 和 S)的 RepBlock,以及用于大型模型(M 和 L)的 CSPStackRep Block。

  • Neck:使用 Rep-PAN 拓?fù)洌褂?RepBlock 或 CSPStackRep 塊增強(qiáng) YOLOv4 和 YOLOv5 中修改后的 PAN 拓?fù)洹_@提供了來自主干網(wǎng)不同級(jí)別的更高效的特征聚合。

  • Head:YOLOv6 引入了 Efficient Decoupled Head,簡(jiǎn)化了設(shè)計(jì)以提高效率。它采用混合通道策略,減少了中間 3×3 卷積層的數(shù)量,并與 backbone 和 neck 一起縮放寬度。

YOLOv6 還整合了其他幾種技術(shù)來提高性能。

  • 標(biāo)簽分配:利用任務(wù)對(duì)齊學(xué)習(xí) (TAL) 來解決分類和框回歸任務(wù)之間的錯(cuò)位。

  • Self-Distillation:它將 Self-Distillation 應(yīng)用于分類和回歸任務(wù),進(jìn)一步提高了準(zhǔn)確性。

  • 損失函數(shù):它使用 VariFocal Loss 進(jìn)行分類,并結(jié)合使用 SIoU 和 GIoU Loss 進(jìn)行回歸。


YOLOv6 代表了一種經(jīng)過改進(jìn)和增強(qiáng)的對(duì)象檢測(cè)方法,它建立在其前輩的優(yōu)勢(shì)之上,同時(shí)引入了創(chuàng)新的解決方案來應(yīng)對(duì)實(shí)際部署的挑戰(zhàn)。它專注于效率、準(zhǔn)確性和工業(yè)適用性,使其成為工業(yè)應(yīng)用的寶貴工具。

YOLOv7

雖然從技術(shù)上講,YOLOv6 是在 YOLOv7 之前引入的,但 YOLOv6 的生產(chǎn)版本是在 YOLOv7 之后推出的,并在性能上超越了它。然而,YOLOv7 引入了一個(gè)新穎的概念,稱其為可訓(xùn)練的免費(fèi)贈(zèng)品袋 (BoF)。這包括一系列細(xì)粒度的改進(jìn),而不是徹底的改革。

這些改進(jìn)主要集中在優(yōu)化訓(xùn)練過程和增強(qiáng)模型學(xué)習(xí)有效表示的能力,而不會(huì)顯著增加計(jì)算成本。以下是 YOLOv7 引入的一些主要功能。

  • 模型重新參數(shù)化:YOLOv7 提出了一個(gè)有計(jì)劃的重新參數(shù)化模型,這是一種適用于不同網(wǎng)絡(luò)中的層的策略,具有梯度傳播路徑的概念。

  • 動(dòng)態(tài)標(biāo)簽分配:使用多個(gè)輸出層訓(xùn)練模型會(huì)帶來一個(gè)新問題:“如何為不同分支的輸出分配動(dòng)態(tài)目標(biāo)?為了解決這個(gè)問題,YOLOv7 引入了一種新的標(biāo)簽分配方法,稱為粗到細(xì)鉛引導(dǎo)標(biāo)簽分配。

  • 擴(kuò)展和復(fù)合縮放:YOLOv7 為對(duì)象檢測(cè)器提出了“擴(kuò)展”和“復(fù)合縮放”方法,可以有效地利用參數(shù)和計(jì)算。


YOLOv7 專注于精細(xì)的細(xì)化和優(yōu)化策略,以增強(qiáng)實(shí)時(shí)對(duì)象檢測(cè)器的性能。它強(qiáng)調(diào)可訓(xùn)練的免費(fèi)贈(zèng)品袋、深度監(jiān)督和架構(gòu)改進(jìn),從而在不犧牲速度的情況下顯著提高準(zhǔn)確性,使其成為 YOLO 系列中的寶貴進(jìn)步。然而,進(jìn)化繼續(xù)產(chǎn)生 YOLOv8,這是我們接下來的主題。

YOLOv8

YOLOv8 是 YOLO 系列實(shí)時(shí)對(duì)象檢測(cè)器的迭代版本,在準(zhǔn)確性和速度方面提供尖端性能。但是,YOLOv8 沒有官方論文,但與 YOLOv5 類似,這是一個(gè)用戶友好的增強(qiáng)型 YOLO 對(duì)象檢測(cè)模型。YOLOv8 由 Ultralytics 開發(fā),引入了新功能和優(yōu)化,使其成為各種應(yīng)用中各種對(duì)象檢測(cè)任務(wù)的理想選擇。以下是其功能的快速概述。

  • 高級(jí) Backbone 和 Neck 架構(gòu)

  • 無錨分體式 Ultralytics 頭:YOLOv8 采用無錨分體式 Ultralytics 頭,與基于錨的方法相比,這有助于提高準(zhǔn)確性和更高效的檢測(cè)過程。

  • 優(yōu)化的準(zhǔn)確性-速度權(quán)衡

除此之外,YOLOv8 還是 Ultralytics 維護(hù)良好的模型,提供了多種模型,每個(gè)模型都專門用于計(jì)算機(jī)視覺中的特定任務(wù),如檢測(cè)、分割、分類和姿勢(shì)檢測(cè)。由于 YOLOv8 通過 Ultralytics 庫易于使用,讓我們?cè)谘菔局袊L試一下。


YOLOv8 模型在各種基準(zhǔn)測(cè)試數(shù)據(jù)集中實(shí)現(xiàn)了 SOTA 性能。例如, YOLOv8n 模型在 COCO 數(shù)據(jù)集上實(shí)現(xiàn)了 37.3 的 mAP (平均精度均值),在 A100 TensorRT 上實(shí)現(xiàn)了 0.99 毫秒的速度。接下來,讓我們看看 YOLO 家族是如何通過 YOLOv9 進(jìn)一步演變的。

YOLOv9

與其前輩相比,YOLOv9 采用了不同的方法,直接解決了深度神經(jīng)網(wǎng)絡(luò)中的信息丟失問題。它引入了可編程梯度信息 (PGI) 的概念和一種稱為廣義高效層聚合網(wǎng)絡(luò) (GELAN) 的新架構(gòu),以應(yīng)對(duì)信息瓶頸并確保訓(xùn)練期間可靠的梯度流。

研究人員之所以引入 YOLOv9,是因?yàn)楝F(xiàn)有的方法忽略了這樣一個(gè)事實(shí),即當(dāng)輸入數(shù)據(jù)進(jìn)行逐層特征提取和空間變換時(shí),會(huì)丟失大量信息。這種信息丟失會(huì)導(dǎo)致梯度不可靠,并阻礙模型學(xué)習(xí)準(zhǔn)確表示的能力。

YOLOv9 引入了 PGI,這是一種通過使用輔助可逆分支生成可靠梯度的新方法。此輔助分支為計(jì)算目標(biāo)函數(shù)提供了完整的輸入信息,從而確保用于更新網(wǎng)絡(luò)權(quán)重的梯度信息量更大。輔助分支的可逆性質(zhì)確保在前饋過程中不會(huì)丟失任何信息。


YOLOv9 還提出了 GELAN 作為一種新的輕量級(jí)架構(gòu),旨在最大化信息流并促進(jìn)獲取相關(guān)信息以進(jìn)行預(yù)測(cè)。GELAN 是 ELAN 架構(gòu)的通用版本,利用任何計(jì)算塊,同時(shí)保持效率和性能。研究人員基于梯度路徑規(guī)劃設(shè)計(jì)了它,確保了通過網(wǎng)絡(luò)的高效信息流。


YOLOv9 通過關(guān)注信息流和梯度質(zhì)量,為對(duì)象檢測(cè)提供了全新的視角。PGI 和 GELAN 的推出使 YOLOv9 有別于其前身。這種對(duì)深度神經(jīng)網(wǎng)絡(luò)中信息處理基礎(chǔ)知識(shí)的關(guān)注可以提高性能,并更好地解釋對(duì)象檢測(cè)中學(xué)習(xí)過程。

YOLOv10

YOLOv10 的推出對(duì)于實(shí)時(shí)端到端對(duì)象檢測(cè)具有革命性意義。YOLOv10 超越了之前的所有速度和精度基準(zhǔn),實(shí)現(xiàn)了真正的實(shí)時(shí)對(duì)象檢測(cè)。YOLOv10 無需使用 NMS 檢測(cè)進(jìn)行非極大值抑制 (NMS) 后處理。

這不僅提高了推理速度,還簡(jiǎn)化了部署過程。YOLOv10 引入了一些關(guān)鍵功能,例如無 NMS 培訓(xùn)和整體設(shè)計(jì)方法,使其在所有指標(biāo)上都表現(xiàn)出色。


  • 無 NMS 檢測(cè):YOLOv10 提供了一種基于一致雙重分配的新穎無 NMS 訓(xùn)練策略。它采用雙標(biāo)簽分配(一對(duì)多和一對(duì)一)和一致的匹配指標(biāo),在訓(xùn)練期間提供豐富的監(jiān)督,同時(shí)在推理過程中消除 NMS。在推理過程中,僅使用 1 對(duì) 1 頭,從而實(shí)現(xiàn)無 NMS 檢測(cè)。

  • 整體效率-精度驅(qū)動(dòng)設(shè)計(jì):YOLOv10 采用整體方法進(jìn)行模型設(shè)計(jì),優(yōu)化各種組件以提高效率和準(zhǔn)確性。它引入了輕量級(jí)分類頭、空間通道解耦下采樣和秩導(dǎo)向塊設(shè)計(jì),以降低計(jì)算成本。


YOLO11:體系結(jié)構(gòu)增強(qiáng)功能

YOLO11 于 2024 年 9 月發(fā)布。它經(jīng)歷了一系列架構(gòu)改進(jìn),并專注于在不犧牲準(zhǔn)確性的情況下提高計(jì)算效率。

它引入了 C3k2 塊和 C2PSA 塊等新型組件,有助于改進(jìn)特征提取和處理。這會(huì)導(dǎo)致性能略好,但模型的參數(shù)要少得多。以下是 YOLO11 的主要功能。

  • C3k2 模塊:YOLO11 引入了 C3k2 模塊,這是一種跨階段部分 (CSP) 瓶頸的計(jì)算高效實(shí)現(xiàn)。它取代了 backbone 和 neck 中的 C2f 塊,并采用兩個(gè)較小的卷積而不是一個(gè)大型卷積,從而減少了處理時(shí)間。

  • C2PSA 模塊:在 Spatial Pyramid Pooling – Fast (SPPF) 模塊之后引入跨階段部分空間注意力 (C2PSA) 模塊,以增強(qiáng)空間注意力。這種注意力機(jī)制使模型能夠更有效地關(guān)注圖像中的重要區(qū)域,從而有可能提高檢測(cè)準(zhǔn)確性。

有了這個(gè),我們討論了整個(gè) YOLO 系列的對(duì)象檢測(cè)模型。但有一件事告訴我,進(jìn)化不會(huì)就此止步,創(chuàng)新將繼續(xù),我們將在未來看到更好的表現(xiàn)。

YOLO 模型的未來

YOLO 系列一直在突破計(jì)算機(jī)視覺的界限。它已經(jīng)從一個(gè)簡(jiǎn)單的架構(gòu)演變成一個(gè)復(fù)雜的系統(tǒng)。每個(gè)版本都引入了新的功能并擴(kuò)展了支持的任務(wù)范圍。

展望未來,提高準(zhǔn)確性、速度和多任務(wù)能力的趨勢(shì)可能會(huì)繼續(xù)下去。潛在的發(fā)展領(lǐng)域包括以下內(nèi)容。

  • 改進(jìn)的可解釋性:使模型的決策過程更加透明。

  • 增強(qiáng)的穩(wěn)健性:使模型對(duì)具有挑戰(zhàn)性的條件更具彈性。

  • 高效部署:針對(duì)各種硬件平臺(tái)優(yōu)化模型。

YOLO 模型的進(jìn)步對(duì)各個(gè)行業(yè)都有重大影響。YOLO 執(zhí)行實(shí)時(shí)對(duì)象檢測(cè)的能力有可能改變我們與視覺世界的交互方式。但是,解決道德考慮和潛在偏見很重要。確保公平、問責(zé)和透明對(duì)于負(fù)責(zé)任的創(chuàng)新至關(guān)重要。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
最敷衍的通知書出現(xiàn)了,家長(zhǎng)以為孩子造假,連一張紙都舍不得給?

最敷衍的通知書出現(xiàn)了,家長(zhǎng)以為孩子造假,連一張紙都舍不得給?

妍妍教育日記
2025-07-03 19:37:27
青島一地管道漏水致路面塌陷一公交車受困,官方通報(bào)

青島一地管道漏水致路面塌陷一公交車受困,官方通報(bào)

界面新聞
2025-07-04 09:54:41
安徽蚌埠市人大常委會(huì)原秘書長(zhǎng)朱琳接受審查調(diào)查

安徽蚌埠市人大常委會(huì)原秘書長(zhǎng)朱琳接受審查調(diào)查

界面新聞
2025-07-04 09:36:28
對(duì)陣水星李月汝繼續(xù)首發(fā)登場(chǎng),飛翼隊(duì)友佩奇迎來復(fù)出

對(duì)陣水星李月汝繼續(xù)首發(fā)登場(chǎng),飛翼隊(duì)友佩奇迎來復(fù)出

雷速體育
2025-07-04 07:32:08
“限籍令”失效了?長(zhǎng)安的荔枝5位主演竟4個(gè)國籍,33位配角純老外

“限籍令”失效了?長(zhǎng)安的荔枝5位主演竟4個(gè)國籍,33位配角純老外

二月侃事
2025-06-13 12:14:38
痞幼與張繼科交往拍私密照!發(fā)文抱怨被騙,床照流出50歲男友分手

痞幼與張繼科交往拍私密照!發(fā)文抱怨被騙,床照流出50歲男友分手

八星人
2025-07-03 12:59:37
大瓜!SHE日本逛街,任家萱發(fā)福明顯,田馥甄孕肚搶鏡疑懷孕七八個(gè)月

大瓜!SHE日本逛街,任家萱發(fā)福明顯,田馥甄孕肚搶鏡疑懷孕七八個(gè)月

扒星人
2025-07-03 11:41:15
8名醫(yī)生集體遇難

8名醫(yī)生集體遇難

醫(yī)脈圈
2025-07-03 12:08:27
湖人簽場(chǎng)均7分強(qiáng)援,送他NBA天字第一號(hào)霸王條款!比肩詹皇PK比爾

湖人簽場(chǎng)均7分強(qiáng)援,送他NBA天字第一號(hào)霸王條款!比肩詹皇PK比爾

嘴炮體壇
2025-07-04 09:36:44
荒誕魔幻的氛圍下,大惡之人為何不被人提及?

荒誕魔幻的氛圍下,大惡之人為何不被人提及?

吳女士
2025-07-02 03:57:17
K1373列車被砸窗后續(xù):官方緊急通報(bào),砸窗者沒錯(cuò),因?yàn)橛腥酥惺?>
    </a>
        <h3>
      <a href=悠閑歷史
2025-07-03 15:10:02
1971年,周恩來人民大會(huì)堂嚎啕大哭,紀(jì)登奎亂了方寸:您該高興

1971年,周恩來人民大會(huì)堂嚎啕大哭,紀(jì)登奎亂了方寸:您該高興

南書房
2025-07-02 13:50:03
小鵬G7上市!果然比小米YU7便宜,各種超越特斯拉Model Y

小鵬G7上市!果然比小米YU7便宜,各種超越特斯拉Model Y

科客
2025-07-03 21:59:45
韓紅撞臉Labubu玩偶,本人認(rèn)證:這太像了!

韓紅撞臉Labubu玩偶,本人認(rèn)證:這太像了!

紅星新聞
2025-07-03 16:21:21
雷軍:YU7 訂單女性用戶占 30%;傳字節(jié)已量產(chǎn)千臺(tái)機(jī)器人;淘寶閃購宣布 500 億補(bǔ)貼 | 極客早知道

雷軍:YU7 訂單女性用戶占 30%;傳字節(jié)已量產(chǎn)千臺(tái)機(jī)器人;淘寶閃購宣布 500 億補(bǔ)貼 | 極客早知道

極客公園
2025-07-03 08:30:16
張柏芝兒子終于長(zhǎng)大!近照曝光后全網(wǎng)震驚:誰是生父已經(jīng)很明顯了

張柏芝兒子終于長(zhǎng)大!近照曝光后全網(wǎng)震驚:誰是生父已經(jīng)很明顯了

扒星人
2025-07-01 14:31:13
已下架,七大著名酸奶全軍覆沒,實(shí)為科技糖水,以后別再當(dāng)冤大頭

已下架,七大著名酸奶全軍覆沒,實(shí)為科技糖水,以后別再當(dāng)冤大頭

深度報(bào)
2025-07-02 20:55:00
3換1!國王報(bào)價(jià)庫明加!勇士態(tài)度明確,拒絕成人之美

3換1!國王報(bào)價(jià)庫明加!勇士態(tài)度明確,拒絕成人之美

鬼魅突破上籃
2025-07-03 14:44:08
何君堯提議,將香港皇后大道改名,并移走女王雕像,換成林則徐像

何君堯提議,將香港皇后大道改名,并移走女王雕像,換成林則徐像

通鑒史智
2025-07-03 14:31:53
張紀(jì)中家保姆闖禍了,燙傷9個(gè)月孩子故意隱瞞,夫妻倆非常生氣

張紀(jì)中家保姆闖禍了,燙傷9個(gè)月孩子故意隱瞞,夫妻倆非常生氣

TVB的四小花
2025-07-04 02:22:57
2025-07-04 10:08:49
人工智能研究 incentive-icons
人工智能研究
分享深度學(xué)習(xí)、CV、NLP
275文章數(shù) 130關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)再創(chuàng)新高,市值已逼近4萬億美元

頭條要聞

烏方"紅軍村"被俄軍集11萬兵力猛攻 俄方戰(zhàn)報(bào)泄露天機(jī)

頭條要聞

烏方"紅軍村"被俄軍集11萬兵力猛攻 俄方戰(zhàn)報(bào)泄露天機(jī)

體育要聞

你永不獨(dú)行!球迷前往安菲爾德悼念若塔

娛樂要聞

森林北又有緋聞傳出?汪峰毫不在意?

財(cái)經(jīng)要聞

闖禍電芯商部分產(chǎn)線停產(chǎn)!羅馬仕通知停工

汽車要聞

6.5秒破百 長(zhǎng)安第三代UNI-V有更強(qiáng)2.0T

態(tài)度原創(chuàng)

本地
親子
教育
旅游
公開課

本地新聞

云游中國 | 穿越三國!赤壁古戰(zhàn)場(chǎng)藏了多少英雄傳奇?

親子要聞

這個(gè)怎么搖晃也不撒落的玩具太懂媽媽了

教育要聞

考大學(xué)選城市:京滬寧漢蓉,杭深蘇穗鎬,這10個(gè)城市為什么香?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 垣曲县| 衡山县| 绥德县| 吉安市| 深圳市| 彰武县| 平湖市| 辰溪县| 宝应县| 沁阳市| 吴川市| 赫章县| 阜新市| 塔河县| 密山市| 北宁市| 垣曲县| 保山市| 八宿县| 黄平县| 县级市| 双流县| 云龙县| 隆安县| 邹平县| 启东市| 全椒县| 扶风县| 甘孜县| 荆州市| 休宁县| 理塘县| 乌兰察布市| 新龙县| 宣化县| 长阳| 景东| 盐津县| 汾阳市| 昂仁县| 锡林浩特市|