前言
千呼萬喚始出來系列,繼YOLOv3兩年後,YOLOv4終於在上週出來了,讓我們來一睹論文真容吧!由於YOLO之父Jeseph Redmon在今年2月已宣佈退出CV學術界,大家都以為YOLO系列已不再更新了,幸而,學術界和開源社群的力量是強大的。另一位曾經參與YOLO專案維護的大神Alexey Bochkovskiy接過了YOLO這面大旗,在arXiv上提交了YOLO v4,而且,這篇論文已經被拉入原來YOLO之父建立的專案主線。
論文連結:https://arxiv.org/abs/2004.10934
程式碼地址:https://github.com/AlexeyAB/darknet
YOLOv4的釋出可以說是YOLO系列的集大成者,裡面涉及了許多tricks的組合。YOLOv4主要是選取了許多features進行組合的形式來對資料集進行測試訓練,從而來驗證效能效果。
論文核心中的核心:作者將 Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT) and Mish-activation. 而且還使用了一些最近出來的新features:WRC, CSP, CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss。透過對這些features進行有效的組合得到了爆炸性的YOLOv4,可以吊打一切的YOLOv4.在MS-COCO資料上:43.5%@AP(65.7%@AP50)同時可以達到65fps@TeslaV100.
AP50:95 / AP50 - FPS (Tesla V100) Paper: https://arxiv.org/abs/2004.10934
YOLOv4論文中所用tricks如下:
用於backbone的BoF:CutMix和Mosaic資料增強,DropBlock正則化,Class label smoothing
用於backbone的BoS:Mish啟用函式,CSP,MiWRC
用於檢測器的BoF:CIoU-loss,CmBN,DropBlock正則化,Mosaic資料增強,Self-Adversarial 訓練,消除網格敏感性,對單個ground-truth使用多個anchor,Cosine annealing scheduler,最佳超引數,Random training shapes
用於檢測器的Bos:Mish啟用函式,SPP,SAM,PAN,DIoU-NMS
文中提供的預訓練模型的權重和引數資訊可見程式碼地址:
YOLO的組成部分
簡而言之:YOLOv4 =CSPDarknet53 SPP PAN YOLOv3
YOLOv4-detector資訊
提出了一種高效而強大的目標檢測模型。它使每個人都可以使用1080 Ti或2080 Ti GPU 訓練超快速和準確的目標檢測器。
在檢測器訓練期間,驗證了SOTA的Bag-of Freebies 和Bag-of-Specials方法的影響。
改進了SOTA的方法,使它們更有效,更適合單GPU訓練,包括CBN [89],PAN [49],SAM [85]等。文章將目前主流的目標檢測器框架進行拆分:input、backbone、neck 和 head 具體如下圖所示:
各類檢測器之間效能的比較
效能炸裂的YOLOv4結果展示
原文連結:
https://blog.csdn.net/mrjkzhangma/article/details/105730677
新勳章,新獎品,高流量,還有更多福利等你來拿
更多精彩推薦
你點的每個“在看”,我都認真當成了喜歡