当前位置:首页 > 公众号精选 > 雷达通信电子战
[导读]之前我们发布过《SAR图像船舶目标检测数据集SSDD》,需要英文原文的请给“雷达通信电子战”微信公众号发送“1010”查看,全文共41页。SSDD训练与测试集的划分标准SSDD的原论文采用了7:1:2的随机比例,将数据集划分为训练集、验证集和测试集。然而,这种随机划分机制将导致测...

之前我们发布过《SAR图像船舶目标检测数据集SSDD》,需要英文原文的请给“雷达通信电子战”微信公众号发送“1010”查看,全文共41页。
SSDD训练与测试集的划分标准



SSDD的原论文采用了7:1:2的随机比例,将数据集划分为训练集、验证集和测试集。然而,这种随机划分机制将导致测试集中样本的极大不确定性,导致使用同一检测算法进行多次训练和测试时,产生不同的结果。这是因为SSDD中的样本数量太少,只有1160个,随机划分可能会破坏训练集和测试集之间的分布一致性。
后来,一些研究人员也采用了其他比例进行训练、验证和测试,但这些不同的数据集划分将导致不统一的方法比较,不利于学术交流。事实上,计算机视觉领域的两个目标检测数据集(PACAL VOC和COCO),都提供了唯一确定的训练集、验证集和测试集,这可确保对比的公平性。
因此,这里对SSDD的训练集和测试集的划分做出了严格的规定。文件编号最后数字为1和9的图像被确定为测试集,其余的被视为训练集。该规则还可以保持训练集和测试集分布的一致性,有利于网络特征学习。
这里没有提供验证集,因为SSDD中的样本数量非常少,因此应该珍惜每个样本,以确保每个测试样本的训练梯度减小。然而,验证集不参与训练梯度下降,这将不可避免地导致船舶特征学习不足。当然,如果研究者想要监控模型在训练过程中是否被过度拟合,他们可以建立多个重叠的交叉验证集来达到目的。
近岸与远海目标划分标准



近岸图像中的陆地背景非常复杂,船舶容易受到港口设施的干扰。为了分别计算近岸和远海这两种情况下算法的性能,这里确定了测试集的近岸和远海图像(近岸图像在下图中以洋红色标记)。在232幅测试图像中,有186幅近海场景图像,而只有46幅近海场景图像。

HRSIDLS-SSDD-v1.0类似,这里将包含陆地的图像视为近岸样本,而将其他图像视为远海样本。近岸和远海样本的数量是极不平衡(分别是19.8%80.2%)的,这种现象与地球的海洋面积比陆地大得多这一事实相符。
然而,深度学习需要大量数据来学习特征,更多的数据可带来更好的学习效益。因此,近岸场景和远海场景之间样本数的不平衡将导致近岸场景和近岸场景之间模型学习表示能力的巨大不平衡。网络将仅擅长于检测许多简单的远海样本中的船。近岸船舶的检测性能将因训练样本少而差,而海上船舶的检测性能将因样本的增加而变得优异。学者在设计检测算法时应特别注意这一问题。

SSDD船舶目标尺寸定义标准



不同类型的船具有不同的尺寸,同一尺寸的船也会有不同的分辨率,这都会导致图像中像素总数的变化,多尺度船舶检测是一项具有挑战性的任务。但到目前为止,在SAR图像中还没有明确的定义哪些船舶是小型船舶,哪些船舶是大型船舶。一些学者认为小于40像素的船只是小型船只,但他们没有考虑到图像的实际分辨率。此外,仅仅根据像素数量来确定船舶的尺寸,这与计算机视觉界的共识不一致。
在SAR船舶检测领域,有人遵循COCO数据集的标准对船舶尺寸进行分类,即BBox<32X32的面积表示小型船舶,32X3296X96的面积表示大型船舶。

然而,该定义仅针对COCO数据集,在SSDD数据集上使用它会有问题,因为它与BBox的面积分布不匹配。因此,需要根据SSDD数据集指定船舶尺寸的定义,此外,还应根据不同的标签类型定义船舶尺寸。最后,根据统计结果,定义了船舶尺寸标准。 SSDD密集分布小尺寸样本标准



由于特征不明确,密集分布的小型船舶很难被检测。为了便于在此特定场景中进行性能评估,这里在测试集中指定了密集分布的小型船舶样本,如下图所示。在232张测试图像中,有10张图像密集分布着小型船舶,根据实际经验,001119.jpg中的船舶最难检测,研究人员可对此给予更多的关注。
密集分布的小船
对于这种困难的样本,这里提供了几种可能的解决方案:1.可以使用随机裁剪数据增强来增加小型船舶在整个图像中的比例。2.可以在深度网络的浅层检测小型船舶,特征损失低。3.可以将CFAR结合到深度网络中,因为CFAR对像素更敏感。4.可以结合视觉显著性理论生成显著性图来指导深度网络学习特征,因为这些小船在人眼观察中非常重要。5.可以设计一个深度网络来超分辨率重建小型船舶,这样,小型船舶的功能将更加丰富。
SSDD在港口密集排列的船舶样本标准



在港口密集排列的船舶也很难被发现。一方面,复杂的陆地背景会降低训练效率,因为训练过程中会产生大量的负样本。另一方面,由于SAR特殊的成像机制和有限的分辨率,并排停泊的船舶会产生船体重叠效应。为了便于在此特定场景中进行性能评估,我们在测试集中指定了港口船舶平行停泊的样本,如下图所示。
港口密集排列的船舶
此外,对于这种困难的样本,这里提供了几种可能的解决方案:1.可以使用注意机制来抑制陆地干扰,从而将注意力集中在船舶区域。2.可以使用分割掩模来辅助船舶检测。3.可以使用生成性对抗网络(GAN)生成此类场景的更多样本,以提高这些船舶的学习比例。4.可以使用软NMS后处理算法来避免漏检。

以上内容来自论文:SAR Ship Detection Dataset (SSDD) Official Release and Comprehensive Data Analysis,需要英文原文的请给“雷达通信电子战”微信公众号发送“1010”查看,全文共41页。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

Mar. 7, 2024 ---- 2023年第三季供应商大幅减少产出,使得Enterprise SSD价格有撑,第四季合约价的反弹吸引买家积极购货,加上服务器品牌商需求也随着2024年企业资本支出展望优于去年,进而扩大...

关键字: NAND Flash 服务器 SSD

1月1日消息,据供应链最新消息称,SSD产品九个季度以来首次上涨,而厂商拟2024年1-3月后持续要求涨价。

关键字: SSD 存储芯片 芯片 英伟达

美光 3500 是全球首款采用200+ 层 NAND 技术的高性能客户端 SSD

关键字: SSD 美光 3500 NAND

Dec. 8, 2023 ---- TrendForce集邦咨询表示,目前CSP业者随着手中库存持续去化,第四季开始已有部分Server OEM开始采购企业级SSD(Enterprise SSD),虽然今年NAND Fl...

关键字: NAND Flash SSD

在计算机硬件领域,硬盘作为存储数据的设备,其性能直接影响到整个系统的运行速度。目前市场上主流的硬盘类型主要有液态硬盘(HDD)和固态硬盘(SSD)。那么,液态硬盘和固态硬盘究竟有什么区别?哪个更好呢?本文将对此进行详细的...

关键字: HDD SSD 固态硬盘

业内消息,受NAND Flash市场长期疲软的影响,传闻美国芯片设计厂商美满科技(Marvell)近日已经对其位于中国台湾的SSD闪存控制器研发团队进行了裁撤,裁员人数高达200人,但此事还需经过公司官方证实。

关键字: 裁员 芯片 SSD NAND Flash 美满科技 Marvell

数据中心可以看作是一台大号的计算机,而云计算同样也符合冯诺依曼结构:数据从存储设备中取出,通过网络传送到计算单元,运算结果通过网络传输至存储设备中保存。 因此要实现更高性能的运算,更高效地支持LLM等新兴应用,算力、网力...

关键字: 平头哥 SSD 镇岳510 分布式存储 玄铁

2023年11月1日,阿里旗下半导体公司“平头哥”宣布,其自主研发的首款SSD主控芯片“镇岳510”正式发布。

关键字: 平头哥 SSD 芯片

轻薄实力! 深圳2023年9月22日 /美通社/ -- 9月20日,由中国电子信息产业发展研究院主办的2023琴珠澳集成电路产业促进峰会暨第十八届"中国...

关键字: FOR PCIE SSD 中国芯

(全球TMT2023年8月30日讯)宜鼎国际(Innodisk)呼应AI边缘运算的高速运算需求,宣布推出全新微型“nanoSSD PCIe 4TE3”产品系列。4TE3是宜鼎旗下首款支持PCIe传输规格的BGA SSD...

关键字: PCIE SSD 微型 产品系列
关闭
关闭