当前位置:首页 > 消费电子 > 视频技术
[导读] 图像处理基本思想和算法研究 刚开始想把这部分内容命名为“基本算法”,意在介绍图像处理中的一些基本算法,后来仔细想想决定不这么写,因为图像处理是一个非常大的概念,图

图像处理基本思想和算法研究

刚开始想把这部分内容命名为“基本算法”,意在介绍图像处理中的一些基本算法,后来仔细想想决定不这么写,因为图像处理是一个非常大的概念,图像处理不等于人脸识别,也不等于模式识别,直接介绍诸如图像处理基本算法之类的内容很容易写成空话,没有什么实际意义。读者有兴趣的话可以直接搜索“图像处理十大经典算法”,适当了解。

       所谓图像处理,就是用计算机对图像进行分析,以达到所需结果的技术,又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素,其值称为灰度值。图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。

万变不离其宗,算法是死的,重在思想。举个例子,在模式识别方向这个方向判断一个学生是否入门有一个非常简单的方法,就是“如果你能把图像很自然的想象成高维空间中的一个点”,那就说明在模式识别方面入门了,可以对图像进行分类了。

 

当然标准不是唯一,在其他领域如目标检测也会有其他的判断标准,总之我们要对图像进行处理,那么图像就不再只是图像,它可能会演变成各种不同形式的概念,可能是点,可能是面,还可能是一个坐标空间。在目标跟踪的经典算法粒子滤波中,将一个个的小图像块看做一个个粒子;在子空间理论中,将一系列图像放在一起构建一个成分主空间(例如主成分分析PCA算法等等。我不会详细介绍这些算法,说多了就显得抽象老套,但我要说的是我们一定要把图像本身理解好,它是一个图像,是一个矩阵,是一个信息的容器,是一种数据的表现形式,图像不一定都必须在视觉上有意义(比如频域的图像)。

总之图像处理的基本思想还是要立足于图像本身,要深度到图像内部结构中,思维要灵活。打个比方说,图像和高维空间中的点之间有什么对应关系,这是所谓的量变产生质变。总之一定要多想,多总结,主动去钻研,才能够真正领悟一些东西。最基本的东西往往蕴藏着深奥的道理,无论你现在多牛多厉害,都不能放掉最本源的东西。多想想图像是什么,有什么本质属性,你可能无法得到准确的答案,但肯定能得到一些有用的感悟(有点像哲学问题了)。

算法研究

算法研究应该是图像处理的核心工作,尤其是各大高校的博士硕士。这里我并不谈那些高大上的算法,我更想说的是一些算法研究的一些基础的东西,比如说一些基础课程,比如说矩阵运算。

研究图像处理的算法,离不开数学。在这里我建议图像处理方面的硕士一定要上两门课:《泛函分析》以及《最优化算法》,有的学校已经将这两门课列为了研究生阶段的必修课程。这两门可可以说是图像处理(至少是模式识别)的基础。我当初没上过最优化算法,但后来也自己补上了,不然真的是寸步难行。至于泛函我当时听课的时候也不是很懂,但是在之后的研究过程中发现很多图像处理的基本知识基本理论都和泛函分析中枯燥的定理如出一辙,没办法,有的东西本身就是枯燥的干货,学着费力,缺它不行。

其次我想说的是矩阵运算。图像就是矩阵,图像处理就是矩阵运算。大家为什么都喜欢用Matlab,就是因为它的矩阵运算能力实在是太强大,在Matlab的世界中任何变量都是矩阵。同样OpenCv之所以能流行,不仅仅是因为它良好的封装性,也是因为它的矩阵格式,它定义了Mat基础类,允许你对矩阵进行各种操作。Python也不例外,它的Numpy就是一个专门的线性代数库。

真正在图像编程过程中,那些看着高大上的API函数归根到底都是工具,查查手册就能找到,真正核心还是在算法,算法是由公式编写的,公式的单元是变量,而图像届的变量就是矩阵。所以,熟练去操作矩阵,求秩、求逆、最小二乘,求协方差,都是家常便饭。所以,如果你有幸能上《矩阵分析》这门课,一定要把它看懂,那里面都是干货。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

引言 随着科技的不断发展,数字图像处理技术也得到了广泛的应用。其中,数码相框是一种可以显示数字照片的数字设备。与传统的相框不同,数码相框可以显示各种类型的照片,包括静态的、动态的、立体的等,同时还可以通过网络进行传...

关键字: 数码相框 图像处理

机器视觉系统是一种利用计算机和图像处理技术来检测和测量物理、化学或生物特征的系统。它广泛应用于制造业、医疗保健、食品和饮料、物流和零售等行业,以实现自动化生产和提高产品质量。下面我们将介绍机器视觉系统的优缺点。

关键字: 机器视觉 图像处理

glmark2是开源的对OpenGL 2.0和 ES 2.0的基准测试程序,对GPU进行基准测试。glmark提供了一系列丰富的测试,涉及图形单元性能(缓冲,建筑,照明,纹理等)的不同方面,允许进行更全面和有意义的测试,...

关键字: ARM FPGA 图像处理 异构处理器

5月26日,Arm公司举行产品发布会,发布多款产品,包括首批Armv9 Cortex CPU内核、新款图像处理器Mali内核,以及互连技术CoreLink的最新版本。籍此“史上最大产品发布会”(Paul Williams...

关键字: ARM 图像处理 半导体

(全球TMT2022年10月17日讯)近日,第17届中国研究生电子设计竞赛全国总决赛评审工作圆满完成。今年,来自全国63个高校的114支参赛队伍报名了TI企业命题,创下历史新高。此次TI的企业命题要求学生基于TI前沿的...

关键字: 电子设计竞赛 MCU 图像处理

ARM 推出了一种新的图像信号处理器,以推进物联网和嵌入式市场的视觉系统,具有 8 个同时输入、HDR 功能和高达 48 兆像素的图像大小。

关键字: 图像处理 边缘计算

摘要:为了能够正确判别税票的粘贴质量,降低废品率,设计了一套基于CNN技术的税票检测装置。该装置加强了税票图像采集的清晰度,摆脱了包装机空间狭小、通道灰暗的限制,为税票检测系统提供了最有利的硬件支持。通过卷积神经网络图像...

关键字: CNN技术 图像处理 在线检测

摘 要:以RGB颜色模式为例,以九宫格为生成对比色目标,利用全组合算法建立数字化配色方案模型,根据不同基值 对结果进行设置,完成了无限组合配色方案的有限生成方案。为配色方案图谱提供了一种便捷的生成算法,适合网页设计、平...

关键字: 数字化配色方案 图像处理 全组合算法 对比色

摘要:针对一些通过头部姿势进行控制的智能设备,提出了基于鼻子相对位置的头势识别技术,并利用图像灰度化、均衡化、卷积、二值化等识别出鼻子位置,然后基于人体功能学特征,根据鼻子在人脸中的相对位置来判定人的头部姿势的实现方法。

关键字: 鼻子检测 头势识别 图像处理 Sobe1算子

摘要:交通标志的自动识别技术是智能车辆中辅助驾驶系统中的关键技术,未来会发挥越来越重要的作用。根据当前 该领域的研究现状,结合图像处理、计算机视觉和模式识别技术,提出了包括道路标志、红绿灯和车道线的道路信息识别 算法,开...

关键字: 计算机视觉 模式识别 道路标志 自动识别 图像处理
关闭
关闭