小目标检测文章阅读_小目标检测模型-程序员宅基地

技术标签: 计算机视觉  深度学习  目标检测  

无人机上目标检测的特点:

1、图像特点

        在多数情况下,无人机的拍摄视野很大,包含丰富的视觉内容,虽然它提供了更全面的场景信息。

缺点:

        1)但是待检测的目标对象通常在图像中占比较小,且没有足够的检测细节;

        2)目标的外观和结构质量都很差,容易与噪声混淆(大视场、小目标引起);

1、遥感图像飞机目标检测与分类算法研究

        学术论文,主要内容为遥感图像飞机检测。

        难点:由于遥感图像的成像时段以及环境条件不一,可见光遥感平台的分辨率、相机F数、飞行高度、视角等参量各有不同,待检测的飞机目标型号各异的原因,遥感图像飞机目标检测这一任务往往需要考虑复杂多变的背景信息和不稳定的目标特性。

文章贡献:

        1)详细描述了数据集制作、数据集划分、指标评价这些基础知识,写文档时可参考;

        2)锚点框 k 均值聚类结果可视化,一定程度上反映了聚类效果;

        3)实验。

1、不同地面采样间隔下各检测算法的平均精度

2、目标尺寸对检测性能影响分析

3、算法综合表现

2、YOLOv5与Deep-S...优化的无人机多目标跟踪算法_罗茜

        基金项目,主要内容为检测模型更改+跟踪。

模型结构如下:

        在骨干网络最后一层将原 始 的 BSP ( Bottleneck and CSP ) 替 换 为Transformer[21]结构,利用 Transformer 捕获全局信息和上下文信息并通过其自注意力机制挖掘潜在的图像特征。 Transformer 结构如图 2 中的 C3TR 模块所示,其包含两个子层: multi-head attention layer(多头注意力层)和 MLP(Multilayer Perception,多层感知机)全连接层;子层之间用残差结构连接,外加LayerNorm 和 Dropout 层防止网络过拟合。

3、多尺度空洞卷积的无人机影像目标检测方法

        本文提出了一种多尺度空洞卷积的无人机影像目标检测方法,在现有的目标检测方法的基础上,增加多尺度的空洞卷积模块,加大视野感知域,提高网络对数据分布情况和数据尺寸差异的学习能力,提升网络对无人机影像中多尺度、复杂背景、存在遮挡情况的目标的检测能力。

模型结构:

4、基于倒置残差注意力的无人机航拍图像小目标检测

        期刊,主要内容:模型结构更改。

        1)在主干网络部分嵌入倒置残差模块与倒置残差注意力模块,利用低维向高维的特征信息映射,从而获得丰富的小目标空间信息和深层语义信息,提升小目标的检测精度;

        2)融合浅层空间信息和深层语义信息,并生成四个不同感受野的检测头,提升模型对小尺寸目标的识别能力;

模型结构预览:

        通过引入本文设计的 IRC3 模块和 IRAC3 模块,提取不同尺度的特征,提高模型对特征的可分辨性,使得特征提取模块能够更有指向性的提取小目标的特征。

5、基于改进 YOLOv4-tiny 的无人机航拍目标检测

        期刊,主要内容:设计注意力模块加入yolov4-tny。

        引入注意力机制,能够对感兴趣区域的特征数据进行动态权重系数加权,提高网络对重点区域的关注,解决由小目标、部分遮挡目标引起的识别困难问题。

        CBAM 结构如图 2 所示,其中通道注意力模块采用并行的方式分别将最大池化和平均池化提取的通道信息经过卷积层压缩过滤并进行融合,最后使用 sigmoid 实现数据归一化从而提高感兴趣通道权重,降低非兴趣通道权重。空间注意力模块则是并行过滤空间信息并融合,再通过卷积提取重要空间信息。两个模块相辅相成,实现感兴趣区域通道和空间信息的提纯。

模型结构中的使用:

6、基于改进 YOLOv4 的自然人群口罩佩戴检测方法

        期刊,主要内容:引入协调注意力机制,扩大感受野并提升算法的鲁棒性。

        引入协调注意力机制,进而提升主干特征提取网络对于浅层次特征图像位置信息的利用进而更好地捕获小物体——口罩,同时能够丰富浅层次特征图像的语义信息和加强远距离依赖关系,更精准地定位和识别目标区域。

        协调注意力机制创新性地将空间位 置 信 息 嵌 入 到 通 道 注 意 力 中,进 而 解决 SE中存在的只考虑内部通道信 息 而 忽 略 位 置 信 息 的 问 题,同 时 也 解决了 CBAM( convolutional block attention module)无法获取 远 距 离 依 赖 关 系 的 问 题,并 且 避 免 引入大的计算开销。

整体结构:

        1、将空间金字塔池化层 SPP 前后的卷积层数均提升为 5 层,提高对小目标的检出;

        2、L3 及 L4 输出至加强特征提取网络之前的卷积层数进行提升,由原先的 1 层卷积提升为 3 层卷积。

        这样做可进一步提升整体网络的容量及深度,提取到更深层次的特征,进一步扩大感受野,同时提升语义表征能力以及算法的鲁棒性。

结果:

7、基于改进 YOLOv4 算法的室内场景目标检测

        期刊,主要工作:模型结构改进。

        1)对于颈部网络,将 CSPNet 结构思想运用到 SPP 和 PANet 模块中,分别记为 CSPSPP和 CSPPAN;

        2)对于颈部和主干网络,同时修改 CSPNet 结构中的残差模块,将残差模块中的3×3 标准卷积替换为深度可分离卷积(Depthwise separable convolution, DS),改进后,主干网络记为 DS-CSPDarknet53,颈部网络中的 CSPPAN 模块记为 DS-CSPPAN。

        CSPNet 结构,形成的 CSPDraknet53网络既减少了网络参数,又提高了检测精度。将 CSPNet结构体系融入 SPP 模块和 PANet 中的连续卷积模块中,以此提高目标检测效果。

        SPP 模块改进后的结构图,在融合多尺度特征前,将网络分成两个部分,一部分特征经过捷径连接,直接与 SPP 融合后的特征合并,这一操作减少了 40%的计算量。图 5为 PANet 中连续卷积模块改进后的结构图,原始 YOLOv4 算法中,深层特征与浅层特征张量拼接后会经历 5 个连续卷积层,考虑梯度消失和梯度爆炸的问题,将连续卷积层改为两个连续的残差块,再通过捷径连接将这两个残差块包围起来,构成 CSPNet 结构。

对比实验:

        1)颈部网络 CSPNet 结构化

        2)深度可分离卷积

        这种轻量化的设计使检测速度(FPS)提升了近 10 个点,代价仅为 mAP 值降低了 0.6%。

8、基于改进 YOLOv5s 的无人机图像实时目标检测

        期刊,主要工作:模型特征融合。

        本文充分利用 YOLOv5s 的优势解决了其深度宽度不均衡、分类精度不足等问题,有效提高了无人机场景下小模型实时检测的精度,主要创新点包括以下几点:

        1) 为解决无人机图像目标尺度差异大、小目标检测率低的问题,分析了深度模型中模型深度和宽度对于无人机图像检测的性能增益,提出了可显著提高感受野的混合残差空洞卷积模块,并结合无人机图像特点对 YOLOv5s 模型进行改进,设计了 YOLOv5sm模型;

        2) 为进一步优化改进模型的实时性与识别率,设计了一种基于目标局部部件特征信息的注意力机制,提出了一种跨阶段注意力特征融合模块 SCAM;

        3) 考虑到目标检测任务中位置回归与分类任务之间的矛盾,通过对 YOLO 检测头进行改进,单独对分类分支进行特征后处理,实现位置回归与分类任务的隔离解耦。

YOLOv5sm 骨干网络:

        无人机图像小目标众多,分辨率高,一味增加深度将严重降低算法实时性。而 YOLOv5s 模型低级特征映射少、感受野小,导致各大目标的召回率、精度偏低,故需针对无人机图像对网络进行调整。

1)Res-DConv模块

        为了解决低层特征感受野较小的问题,本文提出了混合残差空洞卷积模块 (Res-DConv),通过有效提高感受野来增强背景信息对回归、分类的指导,并避免降低局部细节信息损失,提高回归的精度。

2)Res-DConv模块(Neck层,分类提高)

        主要思想是基于低分辨率特征图的空间注意力对高分辨率特征图进行加权筛选,用以增强目标的部件特征,提高特征利用率,增强检测器的分类性能。本文称之为跨阶段注意力模块 (stage crossed attention module, SCAM)。

        SCAM 模块可取代下采样模块:首先低分辨率特征经过最大池化和均值池化,连接后经过混合空洞卷积后得到注意力掩码图像 Mask;然后对高分辨率特征按照尺度转通道进行处理 (下转换) 结合 Mask掩码对高分辨率特征进行加权,后经过通道注意力[24]调整通道得到待融合特征;最后将高阶特征与处理后的低阶特征按维度级联融合得到融合特征。

3)整体模型结构

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_34910922/article/details/128193177

智能推荐

求链式线性表的倒数第K项_c语言 求链式线性表的倒数第k项 分数 12 作者 ds课程组 单位 浙江大学 给定一系列-程序员宅基地

文章浏览阅读565次。求链式线性表的倒数第K项给定一系列正整数,请设计一个尽可能高效的算法,查找倒数第K个位置上的数字。输入格式:输入首先给出一个正整数K,随后是若干非负整数,最后以一个负整数表示结尾(该负数不算在序列内,不要处理)。输出格式:输出倒数第K个位置上的数据。如果这个位置不存在,输出错误信息NULL。输入样例:4 1 2 3 4 5 6 7 8 9 0 -1输出样例:7标程​ 单链表版#include<map>#include<list>#include<cm_c语言 求链式线性表的倒数第k项 分数 12 作者 ds课程组 单位 浙江大学 给定一系列

使用YOLOX进行物体检测_yolox 刀具-程序员宅基地

文章浏览阅读1.4k次。YOLOX 是旷视开源的高性能检测器。旷视的研究者将解耦头、数据增强、无锚点以及标签分类等目标检测领域的优秀进展与 YOLO 进行了巧妙的集成组合,提出了 YOLOX,不仅实现了超越 YOLOv3、YOLOv4 和 YOLOv5 的 AP,而且取得了极具竞争力的推理速度。其中YOLOX-L版本以 68.9 FPS 的速度在 COCO 上实现了 50.0% AP,比 YOLOv5-L 高出 1.8% AP!还提供了支持 ONNX、TensorRT、NCNN 和 Openvino 的部署版本,本文将详细介绍如_yolox 刀具

一文搞懂 UML 类图!!!_uml类图-程序员宅基地

文章浏览阅读2.9k次,点赞27次,收藏45次。统一建模语言UML类图是一种用于描述系统结构的图形化工具。它以类和对象为基础,主要用于表示系统中的类、接口、继承关系、关联关系等元素,以及它们之间的静态结构和关系。在本文中,将深入介绍UML类图的基本元素关系类型以及如何创建一个简单而有效的类图。类图以反映类的结构(属性、操作)以及类之间的关系为主要目的,描述了软件系统的结构,是一种静态建模方法。类图用来描述系统中有意义的概念,包括具体的概念、抽象的概念、实现方面的概念等,是对现实世界中事物的抽象。_uml类图

Python数据分析之使用pandas-datareader获取国家经济信息进行分析-程序员宅基地

文章浏览阅读4.2k次,点赞4次,收藏26次。pandas-datareader背景介绍当熟悉了Pandas的两个主要数据结构:Series和DataFrame之后,我们就可以使用pandas-datareader进行金融财经数据的导入和初步分析了。pandas-datareader是基于Python的专门从一系列的公开在线数据库获取数据的工具库,该接口在urllib3库基础上实现了以客户端身份访问在线数据库的各类金融财经股票数据。相关参考网站官网官方文档GIT源码安装pandas-datareader可以使用标准的pip进_pandas-datareader

关于计算机职业发展方向,计算机专业的职业发展方向有哪些-程序员宅基地

文章浏览阅读860次。原标题:计算机专业的职业发展方向有哪些很多人都知道计算机是最近几年 比较热门的专业之一,其中薪资高待遇好是很多年轻人加入该行业的原因,但还有一些人会担心计算机专业的未来,毕竟这股“热潮”在互联网行业大裁员中变成让互联网人感觉压力山大的“寒潮”。究竟计算机的未来如何,小编不敢吹嘘说很好,但我相信计算机行业的未来肯定不会差,而且对计算机人才会越来越重视。 我们经常会听到有人说程序员是吃青春饭的,真是这..._机算机职业发展

词典编码:LZ77算法(C/C++)_lz77编码例题详解-程序员宅基地

文章浏览阅读3.2k次,点赞4次,收藏27次。一、基本思想用指向早期曾经出现过的字符串的指针来表示当前被编码的字符串,如:二、LZ77算法算法伪码:示意图:举例:三、C\C++实现#include <iostream>#include <vector>#include <string>using namespace std;struct code { int off; i..._lz77编码例题详解

随便推点

数据可视化——Matlab平台gramm工具箱绘制散点相关图_gramm工具箱画图-程序员宅基地

文章浏览阅读6k次,点赞6次,收藏30次。数据可视化——Matlab平台gramm工具箱绘制散点相关图概述:基于matlab平台的gramm工具箱绘制散点相关图使用的工具箱:gramm。gramm工具箱使得matlab平台的图形绘制能力更加强大,绘制出的图形更美观,同时,绘制图形需要设置的参数相对较少。gramm工具箱可在以下链接中下载:https://github.com/piermorel/gramm将下载好的工具箱解压之后,通..._gramm工具箱画图

Rxjava3文档级教程一: 介绍和基本使用-程序员宅基地

文章浏览阅读3.9w次,点赞33次,收藏175次。一 Rxjava3简介RxJava是响应式编程(Reactive Extensions)的java实现,它基于观察者模式的实现了异步编程接口。Rxjava 3.x 的github官网RxJava2将被支持到2021年2月28日,错误的会同时在2.x和3.x修复,但新功能只会在3.x上添加。Rxjava 3.0的一些改变:官方WikiRxjava 3.x 文档可以在官方javad..._rxjava

hssfrow 单元格样式_POI设置excle单元格样式-程序员宅基地

文章浏览阅读124次。public class ExcelTest {/*** @param args*/public static void main(String[] args) throws IOException {try {HSSFWorkbook wb = new HSSFWorkbook();HSSFSheet sheet = wb.createSheet("new sheet");HSSFCellS..._hssfrow.setcellstyle

python解析http数据包_python如何解析HTTP返回的标准数据包-程序员宅基地

文章浏览阅读1.5k次。该篇内容由个人博客点击跳转同步更新!转载请注明出处!前言最近有一个需求需要频繁调用xx接口,但这个接口调用次数一多就会给你禁掉,而且一禁就是禁一天的那种,只能通过界面模拟用户操作抓取数据包,然后单独对这些数据包进行处理具体步骤首先看下需要格式化的数据包长什么样 数据包这就是完整的一个数据包,网上基本都是格式化json数据包的,但返回的内容中还包含了头信息等所以不能简单的通过json来格式化,..._python解析http.client.httpresponse

uni-app修改button按钮样式_uniapp按钮样式怎么改-程序员宅基地

文章浏览阅读1.7k次。uni-app修改button按钮样式_uniapp按钮样式怎么改

9、数据采集系统Flume配置安装_修改文件,配置文件flume-env.sh-程序员宅基地

文章浏览阅读200次。Flume配置安装Flume是Cloudera提供的一个高可用的,高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。Flume特点如下:Flume可以高效率的将多个网站服务器中收集的日志信息存入HDFS/HBase中Flume可以将从多个服务器中获取的数..._修改文件,配置文件flume-env.sh

推荐文章

热门文章

相关标签