当前位置:首页 > 芯闻号 > 充电吧
[导读]准确率、召回率:T/F表示 true/false  表示预测的是不是对的P/N表示 positive/negative  表示预测的结果是1还是0 TP: 预测为1, 实际为1,预测正确FP: 预测为

准确率、召回率:

T/F表示 true/false  表示预测的是不是对的

P/N表示 positive/negative  表示预测的结果是1还是0

 

TP: 预测为1, 实际为1,预测正确

FP: 预测为1, 实际为0,预测错误

TN: 预测为0,实际为0,预测正确

FN: 预测为0, 实际为1,预测错误

准确率precision: TP/ (TP+FP)

召回率recall: TP/ (TP +FN)

mAP:

# evaluation_detection.md

每个模型的好坏是通过评价它在某个数据集上的性能来判断的,这个数据集通常被叫做`验证/测试`数据集.这个性能由不同的统计量来度量,包括准确率(accuracy),精确率(precision),召回率(recall)等等.我们会根据某个特定的应用场景来选择相应的统计量.而对每个应用来说,找到一个可以客观地比较模型好坏的度量标准至关重要.在本文,我们将讨论目标检测问题中最常用的度量标准:

- 平均精度均值:`Mean Average Precision, mAP`

## 目标检测问题
对于目标检测问题,我的意思是,给定一张图片,找到图中的所有目标,确定他们的位置并对他们进行分类.目标检测模型通常是在给定的固定类别上进行训练的,因此模型在图中只能定位和分类这些已有的类别.此外,目标的位置通常是用边界框的形式来确定的.因此,目标检测包含了两个任务:

- 确定图片中目标的位置
- 以及对目标进行分类

## 评估模型检测模型

### 为什么选择`mAP`?
目标检测问题中,每张图片中可能会含有不同类别的不同目标.如前文所说,模型的分类和定位性能都需要被评估.因此,精确率,这个图像分类问题中使用的标准的评价度量,并不能直接用在这里.现在,是平均精度均值`mAP`发挥作用的时候了.我希望,读完本文之后你可以理解`mAP`的含义和意义.

### 参考标准(Ground Truth)
对于任何算法来说,度量的值总是把预测值和参考标准的信息进行比较之后计算得到的.我们知道训练,验证和测试数据集的参考标准信息.在目标检测问题中,参考标准的信息包括图像,图像中目标的类别,以及每个目标的真实边界框.

### 一个例子
我们给定了真实图片和其他解释性文字:

![](evaluation_detection01.jpg)

画在图片上的框和标签只是方便我们自己观看.我们在训练期间得到的是没有边界框和类别标签的图片.以及三组定义了参考标准的数字(让我们假设这张图片的分辨率是`1000x800`像素,表中所有坐标的单位都是像素,坐标值大小是估计的).

![](evaluation_detection02.png)

## 计算mAP
让我们假设原始图片和参考标准的解释性文字如上文所述.训练数据和验证数据的所有图像以相同的方法进行了标注.

训练好的模型会返回许多预测结果,但是这些预测结果中的大多数都会有非常低的置信度分数,因此我们只需考虑那些超过某个报告置信度分数的预测结果.

我们用模型对原始图像进行处理,下面是目标检测模型在置信度阈值化之后返回的结果:

![](evaluation_detection01.jpg)

我们可以说这些检测结果是正确的,但是我们怎么量化呢?

首先,我们需要知道每个检测结果的正确性.能够告诉我们一个给定的边界框的正确性的度量标准是`交并比(Intersection over Union, IoU)`.这是一个非常简单的可视量.

### IoU
交并比是预测边界框和参考边界框的交集和并集之间的比率.这个统计量也叫做`Jaccard`指数,是由Paul Jaccard在20世纪初首次提出的.

![](evaluation_detection03.png)

### 分辨正确检测结果和计算精确率
利用`IoU`,我们现在要分辨检测结果是否正确.最常用的阈值是`0.5`:如果`IoU > 0.5`,那么认为这是一个正确检测,否则认为这是一个错误检测.

现在我们为模型生成的每一个检测框计算其`IoU`值(置信度阈值化之后).利用该`IoU`值以及我们的`IoU`阈值`0.5`,我们为图片中的每一个类计算模型正确检测的数量`A(True Positives)`.

现在对于每一张图片,我们为图片中的每一个类计算模型检测的数量`B(Total Objects)`.现在我们可以用这条公式计算模型对`C类别`的精确率`:

![](evaluation_detection04.png)

对于一个给定的类别,让我们对验证集中的每张图片都计算它的精确率.假设我们的验证集中有100张图片,这样对于每个类别,我们会有100个精度率的值(每张图片一个值).让我们对这些100个值进行平均.这个平均值叫做该类的`AP(Average Precision)`:

![](evaluation_detection05.png)

现在,假设在我们整个数据集中有20个类别.对每一个类别,我们都会进行相同的操作:

- `计算IoU -> 精确率(Precision) -> 平均精度(Average Precision)`

所以我们会有20个不同的平均精度值.利用这些平均精度值,我们可以很轻松地判断我们的模型对任何给定的类别的性能.为了只用一个数字来表示一个模型的性能(一个度量解决所有问题),我们对所有类别的平均精度值计算其均值.这个新的值,就是我们的平均精度均值`mAP(Mean Average Precision)`!!!

![](evaluation_detection06.png)

所以,平均精度均值即数据集中所有类别的平均精度的均值.

## 概念说明
目标检测中衡量识别精度的指标是`mAP(mean average precision)`.在多个类别物体检测中,每一个类别都可以根据`recall`和`precision`绘制一条曲线,`AP`就是该曲线下的面积,`mAP`是多个类别`AP`的平均值,理论上最高`mAP`为1.0,也就是我们说的100分.

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭