当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 机器学习(Machine Learning, ML)的目的是根据给定的训练样本求对某系统输入输出之间依赖关系的估计,使它(这种关系)能够对未知输出做出尽可能准确地预测。机器学习至今没有一个精 确

机器学习(Machine Learning, ML)的目的是根据给定的训练样本求对某系统输入输出之间依赖关系的估计,使它(这种关系)能够对未知输出做出尽可能准确地预测。机器学习至今没有一个精 确的公认的定义。作为人工智能(ArTIficial Intelligence, AI)的一个重要研究领域,ML的研究工作主要围绕学习机理、学习方法和面向任务这三个基本方面进行研究。模式识别、函数逼近和概率密度估计是三类基本的ML问题。

从数学的角度来考虑,机器学习问题就是已知n个独立同分布的观测样本,在同一组预测函数中求一个最优的函数对依赖关系进行估计,使期望风险R[f]最小。损失函数是评价预测准确程度的一种度量,它与预测函数f(x)密切相关。而f(x)的期望风险依赖于概率分布和损失函数,前者是客观存在的,后者是根据具体问题选定的,带有(主观的)人为的或偏好色彩。期望风险的大小直观上可以理解为,当我们用f(x)进行预测时,“平均”的损失程度,或“平均”犯错误的程度。

但是,只有样本却无法计算期望风险,因此,传统的学习方法用样本定义经验风险Remp[f]作为对期望风险的估计,并设计学习算法使之最小化。即所谓的经验风险最小化(Empirical Risk MinimizaTIon, ERM)归纳原则。经验风险是用损失函数来计算的。对 于模式识别问题的损失函数来说,经验风险就是训练样本错误率;对于函数逼近问题的损失函数来说,就是平方训练误差;而对于概率密度估计问题的损失函数来 说,ERM准则就等价于最大似然法。事实上,用ERM准则代替期望风险最小化并没有经过充分的理论论证,只是直观上合理的想当然做法。也就是说,经验风险最小不一定意味着期望风险最小。其实,只有样本数目趋近于无穷大时,经验风险才有可能趋近于期望风险。但是很多问题中样本数目离无穷大很远,那么在有限样本下ERM准则就不一定能使真实风险较小啦。ERM准则不成功的一个例子就是神经网络的过学习问题(某些情况下,训练误差过小反而导致推广能力下降,或者说是训练误差过小导致了预测错误率的增加,即真实风险的增加)。

统计学习理论(StaTIsTIcal Learning Theory, SLT)和支持向量机(Support Vector Machine, SVM)建立了一套较好的有限训练样本下机器学习的理论框架和通用方法,既有严格的理论基础,又能较好地解决小样本、非线性、高维数和局部极小点等实际问 题,其核心思想就是学习机器(又叫预测函数,或学习函数,或学习模型)F要与有限的训练样本相适应。在学习算法中需要选择恰当的F,这里的关键因素是F的大小,或者F的丰富程度,或者说F的“表达能力”,VC维(Vapnik-Chervonenkis Dimension)就是对这种“表达能力”的一种描述。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

5月26日,华为ICT大赛2023-2024全球总决赛闭幕式暨颁奖典礼在深圳举行。本届大赛为华为历届最大规模的线下比赛,共吸引了全球80多个国家和地区、2000多所院校、17万余名学生报名参赛,经过国家赛、区域赛层层选拔...

关键字: ICT 华为 大赛 人工智能

近日,整数智能与浪潮信息签署元脑生态战略合作协议。双方将秉持协同共生、开放共赢的原则,在元脑生态的框架内开展AI与数据科学领域的深度协作,共同为各行业提供更安全高效的数据管理平台,用智能标注助力数据生产的低成本、高精度、...

关键字: 自动化 人工智能 元脑生态

2024年5月25日,上海市欧美同学会长宁分会与曼彻斯特大学中国中心以"智能向善 AI for good"为主题,联合举办了"第二届人工智能论坛"。人工智能领域的企业家和专家学者发表主题演讲及参与圆桌论坛,逾百余位海归学...

关键字: 人工智能 AI 大语言模型

进入人工智能时代,数据重要性进一步凸显。今年,国家数据局等17部门联合印发的《"数据要素x"三年行动计划》指出,要以数据驱动发现新规律、创造新知识,加速科学研究范式变革。北京材料基因工程高精尖创新中心在浪潮信息助力下,通...

关键字: 新材料 数据中心 人工智能

2024年5月28日,中国上海 —— 今日,备受瞩目的Keysight World Tech Day 2024在上海隆重拉开帷幕。作为是德科技年度盛大的技术交流盛会,它不仅是电子测试测量及相关应用领域最新行业趋势与前沿测...

关键字: 测试测量 人工智能 新能源汽车

加利福尼亚州 坎贝尔 – 2024 年 5月 21 日 – Arteris, Inc.(纳斯达克股票代码:AIP)是一家领先的系统 IP 供应商,致力于加速片上系统(SoC)的创建,晶心科技(台湾证券交易所股票代码:65...

关键字: 片上系统 RISC-V 人工智能

在更快的连接速度、更高的自动化程度和更智能系统的推动下,工业4.0加快了视觉技术在制造业中的应用,并将智能化引入到以往简单的数据采集系统中。上一代视觉系统负责捕捉图像,对其进行封装以供传输,并为后续的FPGA、ASIC或...

关键字: 图像传感器 工业4.0 机器学习

上海2024年5月23日 /美通社/ -- 威联通®科技 (QNAP® Systems, Inc.) 今日宣布其 S3 物件存储方案 QuObjects 以 QTS 和 QuTS hero 两项 NAS 作业系统上通过...

关键字: 存储 数据管理 机器学习

5月23日消息,近日在澳门举行的BEYOND国际科技创新博览会上,科大讯飞董事长刘庆峰表示,中美在通用大模型底座上的差距,是半年到一年半之间的动态追赶,不会被甩开。

关键字: 科大讯飞 人工智能 AI

根据Gartner日前预测,受到生成式人工智能(GenAI)和应用现代化的推动,全球用户今年在公有云服务上的支出将增长到6754亿美元。这一数字与去年的5,610亿美元相比大幅增长了20.4%。

关键字: 生成式AI 公有云 人工智能 GenAI
关闭
关闭