計算機視覺研究院
目標檢測乾貨 | 多級特徵重複使用大幅度提升檢測精度(文末附論文下載)
目前,在zero-shot學習中仍存在一些需要解決的問題,如domain shift problem, hubness problem和semantic gap問題。
基於DIou改進的YOLOv3目標檢測
文中指出DIoU要比GIou更加符合目標框回歸的機制,將目標與anchor之間的距離,重疊率以及尺度都考慮進去,使得目標框回歸變得更加穩定,不會像IoU和GIoU一樣出現訓練過程中發散等問題,並且方法能夠簡單地遷移到現有的算法中帶來性能的提升,實驗在YOLOv3上提升了5.91mAP。
AAAI 2023:清華SIGS信息學部19篇論文入選,含多模態、目標檢測、語義分割等方向
2022關注並星標從此不迷路計算機視覺研究院計算機視覺研究院專欄作者:Edison_GAAAI是人工智慧領域最重要的頂級國際學術會議之一,旨在推動人工智慧領域的研究和應用,增進大眾對人工智慧的了解。據悉,AAAI本年度共接收8777篇論文投稿,錄取率僅為19.6%。
Sparse R-CNN:稀疏框架,端到端的目標檢測(附源碼)
Sparse R-CNN拋棄了anchor boxes或者reference point等dense概念,直接從a sparse set of learnable proposals出發,沒有NMS後處理,整個網絡異常乾淨和簡潔,可以看做是一個全新的檢測範式。
Double-Head:檢測頭上再創新,提升精度(附原論文下載)
兩種頭結構已廣泛用於基於 R-CNN 的檢測器中,用於分類和定位任務。Comparison between Single-FC and Double-FC。
多尺度特徵融合:為檢測學習更好的語義信息(附論文下載)
它首先使用卷積神經網絡從輸入圖像中提取視覺特徵,然後通道注意力模塊重新加權通道特徵以增強不同特徵圖的一致性。
YOLOS:通過目標檢測重新思考Transformer(附原始碼)
為了回答這個問題,今天就展示了「You Only Look at One Sequence」 ,這是一系列基於樸素視覺變換器的目標檢測模型,具有儘可能少的修改和inductive biases。
最近大火的多模態 , 落地了嗎?
多模態機器學習,英文全稱 MultiModal Machine Learning (MMML),旨在通過機器學習的方法實現處理和理解多源模態信息的能力。
在單機上快速、精確的100000類別的檢測
計算機視覺研究院專欄作者:Edison_G今天帶來的這篇推送,估計您有讀過或試驗過,但是為了讓更多的科研學者知道這麼「牛」的內容知識,接下來就開始說說今天的主題——1000000類的快速精確檢測。