当前位置:首页 > 物联网 > 《物联网技术》杂志
[导读]摘 要:人工智能是20世纪三大科学技术成就之一,数学是其关键的理论基础,使其成为了一门规范的科学。以人工智能的萌芽期、诞生期、发展期为视角,介绍了人工智能典型数学基础——布尔逻辑、概率论、可计算理论、模糊集理论、粗糙集理论、混沌与分形、核函数和主曲线、云模型、贝叶斯网等的发展简史,并对人工智能的数学基础发展趋势做了展望。


引 言

人工智能、空间技术和原子能技术被称为20 世纪的三大科学技术成就,人工智能的研究开展是智能机器人技术、信息技术、自动化技术以及探索人类自身智能奥秘的需要[1]。科学界有一个共识,即智能化是管理、自动化、计算机以及通信等技术领域的新方法、新技术、新产品的重要发展方向。人工智能是由数学、哲学、心理学、神经生理学、语言学、信息论、控制论、计算机科学等多学科相互渗透而发展起来的综合性新学科[2]。数学使人工智能成为一门规范的科学,是人工智能发展必不可少的基础,在人工智能的各个发展阶段都起着关键的作用。目前,关于人工智能数学发展史的研究综述还很少。本文以人工智能发展的三个阶段萌芽期、诞生期、发展期为视角,介绍了人工智能的数学基础发展史,并对其数学基础的发展趋势进行了展望。

1 人工智能萌芽期的数学基础

1956年以前被称为人工智能的萌芽期,在这个期间,布尔逻辑、概率论、可计算理论取得了长足的发展。布尔逻辑是英国数学家GeorgeBoole 于19世纪中叶提出,典型的一元算符叫做逻辑非(NOT),基本的二元算符为逻辑或(OR)和逻辑与(AND), 衍生的二元算符为逻辑异或(XOR)[3]。在 Boole逻辑的基础上,Frege发展出了一阶逻辑,研究了命题及由这些命题和量词、连接词组成的更复杂的命题之间的推理关系与推理规则[4],从而出现了谓词演算。这就奠定了人工智能抽取合理结论的形式化规则 命题逻辑和一阶谓词逻辑。

人工智能要解决各种不确定问题如天气预测、经济形势预测、自然语言理解等,这需要数学为其提供不确定推理的基础,概率理论则是实现不确定推理的数学基础。概率理论源于 17 世纪,有数百年的发展。瑞士数学家 Jacob Bernoulli 证明了伯努力大数定理, 从理论上支持了频率的稳定性; P.S.Laplace 和J.W.Lindeberg 证明了中心极限定理;20 世纪初,俄国数学家 A.N.Kolmogrov 逐步建立了概率的公理化体系; K.Pearson 将标准差、正态曲线、平均变差、均方根误差等统计方法用于生物统计研究,为概率论在自然科学中的应用做出了卓越的贡献 ;R.Brown 发现了布朗运动,维纳提出了布朗运动的数学模型,奠定了随机过程的基础 ;A.K.Erlang 提出了泊松过程,成为排队论的开创者 [5]。概率论、随机过程、数理统计构成了概率理论,为人工智能处理各种不确定问题奠定了基础。

支持向量机是人工智能的主要分类方法之一,其数学基础为核函数。1909年,英国学者JamesMercer用Mercer定理证明了核函数的存在[6]。可计算理论是人工智能的重要理论基础和工具,建立于20世纪30年代。为了回答是否存在不可判定的问题,数理逻辑学家提出了关于算法的定义(把一般数学推理形式化为逻辑演绎)。可以被计算,就是要找到一个解决问题的算法[7]。1900年,David Hilber提出了著名的23个问题,其最后一个问题:是否存在一个算法可以判定任何涉及自然数的逻辑命题的真实性。1931,KurtGodel证明了这一问题,确实存在真实的局限整数的某些函数无法用算法表示,即不可计算。在不可计算性以外,如果解决一个问题需要的计算时间随着实例规模呈指数级增长,则该问题被称为不可操作的,对这个问题的研究产生了计算复杂性。计算复杂性是讨论P=NP 的问题,这个问题到现在都是计算机科学中最大的未解决问题之一[8]。关于P与NP问题有很多定义, 较为典型的一种定义是在确定图灵机(人工智能之父英国数学家图灵1937年提出的一种机器计算模型,包括存储器、表示语言、扫描、计算意向和执行下一步计算)上能用多项式求解的问题是P 问题,在非确定图灵机上能用多项式求解的问题是NP 问题 [9]。可计算性和计算复杂性为人工智能判断问题求解可能性奠定了数学基础。

2 人工智能诞生期的数学基础

1956 年,麦卡锡、明斯基、香农和罗切斯特等学者召开了达特莫斯会议,该会议集聚了数学、心理学、神经生理学、信息论和电脑科学等研究领域的年轻精英。该会议历时两个月,学者们在充分讨论的基础上,首次将人工智能作为一门新学科提出来。1956 年至1961 年被称为人工智能的诞生期。混沌是人工智能不确定推理的新的数学理论基础,最早来源于物理学科的研究。学术界认为,第一位发展混沌现象的学者是法国数学家物理学家庞加莱,他发现了天体动力学方程的某些解的不可预见性,即动力学混沌现象。以科尔莫戈夫、阿诺德和莫泽三个人命名的 KAM 定理被认为是创建混沌理论的标志[10]。在概率论的基础上,出现了条件概率及贝叶斯定理, 奠定了大多数人工智能系统中不确定推理的现代方法基础[5]。

3 人工智能发展期的数学基础

1961 年之后,被称为是人工智能的发展期。在这期间, 人工智能在机器证明、专家系统、第五代计算机、模式识别、人脑复制、人脑与电脑连接以及生物智能等领域取得了很多理论和实践成果。所有的成果都离不开数学知识的支撑,人工智能的数学基础在这个时期也取得了长足的发展。

混沌与分形为人工智能的不确定推理打开了新的思路, 在人工智能的发展期,混沌与分形完成了理论的发展和应用研究的开展。1963 年,美国气象学家 E.N.Lorenz 在研究耗散系统时首先发现了混沌运动,在他当年发表的论文 确定性非周期流 中解释了混沌运动的基本特征,介绍了洛伦兹吸引子和计算机数值模拟研究混沌的方法;1971 年,法国的D.Ruelle 和荷兰的F.Takens 首次用混沌研究湍流,发现了一类特别复杂的新型混沌吸引子;1975 年,华人学者李天岩和导师J.Yorke 对混沌的数学特征进行了研究,标志着混沌理论的基本形成; 1979 年,E.N.Lorenz 在美国科学促进会的一次演讲中提出了著名的 蝴蝶效应 ,使得混沌学令人着迷、令人激动,激励着越来越多的学者参与到混沌学的理论和应用研究中来。1989 年,R.L.Devney 给出了混沌的数学定义 :设 X 是一个度量空间,f是一个连续映射,如果 f 满足以下三个条件则称为X 上的混沌。

(1)f 是拓扑传递的;

(2)f 的周期点在 X 中稠密;

(3)f 对初始条件敏感。

混沌理论在复杂问题优化、联想记忆和图像处理、模式识别、网络通信等诸多领域都有成功的运用。Yamada T 将混沌神经网络用于TSP 问题优化中,结果混沌神经网络表现出强大的优化性能 [11]。混沌理论在联想记忆的应用上显示出优越的性能,可应用于信息存储、信息检索、联想记忆、图像识别等方面[12]。模式识别是人工智能的主要研究问题之一,混沌学在此领域也有成功的应用,Kyung Rung[13] 将混沌回归神经网络应用于朝鲜口语数字和单音节语音识别,与常规的回归神经网络相比,新方法的效果更佳。李绪[14] 等将混沌神经网络模型应用于手写体数字识别和简单图像识别,实验显示,混沌神经网络对手写体识别正确率和可靠度高达 90% 以上。

1967 年,法国数学家 B.B.Mandel brot 提出了分形学的里程碑问题 英国海岸线有多长?成为人类研究分形几何的开端 [15],分形理论是对欧氏几何相关理论的拓展和延伸。1968 年,Madndelbrot 和 Ness 提出了分形布朗运动,并给出了离散分形布朗随机场的定义 [16]。Peleg S 于 1984 年提出了双毯覆盖模型[17],这是对Mandel brot 在估计英国海岸线长度时的一种推广。基于分形的理论和思想,人们抽象出一种方法论分形方法论[17],该理论在人工智能领域的典型应用是用于网络流量分析。1993 年以来,陆续有许多这方面的研究成果出现。通过对局域网高分辨率的测量分析,leland[18] 发现以太网流量表现出自相似的分形性质。进一步深入研究发现,在较小的时间尺度上,网络流量体现出更复杂的变化规律,由此出现了多重分形的概念[19]。分形理论用于实现网络流量智能分析, 已经有很多成功的案例,如TCP 流量的拥塞控制[20],Internet 流量建模 [21]。陆锦军等还提出了网络行为的概念[22],用于研究大规模网络上观测到的尺度行为。

扎德对不确定性就是随机性这一长期以来的观点提出了挑战,认为有一类不确定性问题无法用概率论解决。1965 年发表了论文Fuzzy Sets,创立了模糊集合论[23]。除了传统的属于或不属于一个集合之外,模糊集认为集合之间还有某种程度隶属于的关系,属于的程度用[0,1] 之间的数值表示,该数值称为隶属度。隶属度函数的确定方法大致有 6 种形态, 包括正态(钟形)隶属度函数、岭形隶属函数、柯西隶属函数、凸凹型隶属函数、隶属函数以及线性隶属函数 [24]。1978 年, 在模糊集的基础上,扎德提出了可能性理论,将不确定理解为与概率不同的 可能性 ,与之对应的可能性测度也是一种集合赋值方法[25]。聚类在人工智能领域有大量应用,是模糊集研究的较早的一个方向[26]。模糊集理论在人工智能领域的典型应用还有数据选择[27]、属性范化[28]、数据总结等[29]。

离开了隶属度或隶属函数的先验信息,模糊集合运算难以进行,粗糙集理论研究了用不确定本身提供的信息来研究不确定性。上世纪 80 年代初,粗糙集的奠基人波兰科学家Pawlak[30] 基于边界区域的思想提出了粗糙集的概念并给出了相应的定义。粗糙集从知识分类入手,研究在保持分类能力不变的情况下,经过知识约简,推出概念的分类规则,最后获得规则知识。粗糙集隶属度函数的定义有多种形式,典型的是Yao Y Y 在 1998 年用三值逻辑进行的定义[31]。粗糙集理论的核心基础是从近似空间导出上下近似算子,典型的构造方法是公理化方法。1994 年,Lin T Y 最早提出用公理化方法研究粗糙集[32],之后不少学者对公理化方法进行了完善和改进。粗糙集在人工智能领域的应用主要体现在知识获取 [33],知识的不确定性度量[34] 和智能化数据挖掘[35] 等方面。

传统的模糊数学存在隶属度、可能测度与概率区分不是绝对分明的问题,目前,已经无法满足很多领域对不确定推理的需要。在发现状态空间理论以及云与语言原子模型后,1993 年,李德毅院士在其文献《隶属云和语言原子模型》[36]中首次提出了云的概念,并逐步建立了云模型。云模型通过3 个数字特征,即期望Ex,熵En 和超熵He 实现定性概念到定量数据间的转化,并以云图的方式表现出来,比传统的模糊概念更直观具体。1995年,李德毅等人在其文献隶属云发生器中系统化的提出了云的概念[37]。1998年,该课题组在一维云的基础上进一步提出了二维云的数学模型和二维云发生器的构成方法[38]。2001年,杜鹢提出了基于云模型的概念划分方法云变换[39]。2003年,李德毅课题组提出了逆向云算法[40]。2004年至2007年,该课题组进一步完善了云模型的数学基础和数学性质,将云模型抽象到更深层次的普适性空间。云模型在人工智能的多个领域都有成功的应用,包括定性知识推理与控制,数据挖掘和模式识别。如1999 年,李德毅将云模型用于倒立摆的控制[41];2002年,张光卫建立了基于云模型的对等网信任模型[42];2001年,岳训等人将云模型用于Web 数据挖掘[43];2003年,田永青等人基于云模型提出了新的决策树生成方法[44];2009年,牟峰等人将云模型用于遗传算法的改进[45]。

贝叶斯网络起源于条件概率,是一种描述变量间不确定因果关系的图形网络模型,是目前人工智能,典型用于各种推理的数学工具。最初的贝叶斯网络时间复杂度很大,限制了其在实际工程中的应用。1986 年,PEARL 提出的消息传递算法为贝叶斯网提供了一个有效算法 [46],为其进入实用领域奠定了数学基础。1992 年,丹麦AALBORG 大学基于贝叶斯网开发了第一个商业软件(HUGIN)[47],可实现贝叶斯网的推理,使贝叶斯网真正进入实用阶段。1997 年,Koller 和 Pfeffer[48] 将面向对象的思想引入贝叶斯网,用于解决大型复杂系统的建模问题。将时间量引入贝叶斯网则形成了动态贝叶斯网[47],动态贝叶斯网提供了随时间变化的建模和推理工具。贝叶斯网络节点兼容离散变量和连续数字变量则形成了混合贝叶斯网,混合贝叶斯网在海量数据的挖掘和推理上有较大优势 [49]。贝叶斯在人工智能领域的应用主要包括故障诊断 [50],系统可靠性分析[51],航空交通管理[52],车辆类型分类[53] 等。

4 结 语

人工智能科学想要解决的问题是让电脑也具有听、说、读、写、思考、学习、适应环境变化以及解决各种实际问题的能力。布尔逻辑、概率论以及可信计算理论为人工智能的诞生奠定了数学基础,这些数学理论经历了上百年的发展,已经比较成熟。混沌与分形、模糊集与粗糙集、云模型等人工智能的数学理论是近 30年发展起来的,为不确定性人工智能奠定了数学基础, 但还存在很多问题需要解决。就混沌与分形来说,其理论体系还不成熟,其应用在复杂问题的优化、联想、记忆等方面将更有生命力;对于粗糙集来说,其理论研究可以从粗糙集的扩展方面进行,并在相关模型下进行应用研究;就云模型来说, 如何揭示其理论上的优势以及和其他相关模型的联系与区别, 以及如何实现数值域和符号域共同表达的云模型都是值得研究的问题。贝叶斯网是人工智能领域目前最有效的推理工具, 将来的研究应集中在概率繁殖算法的改进、混合贝叶斯网以及动态贝叶斯网的扩展研究等方面。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

2024年4月12日,中国--服务多重电子应用领域、全球排名前列的半导体公司意法半导体(STMicroelectronics,简称ST;纽约证券交易所代码:STM)宣布,松下自行车科技有限公司(Panasonic)宣布采...

关键字: 人工智能 电动自行车

4月17日消息,斯坦福大学近日发布《2024年AI指数报告》(AI Index Report 2024),凭借AI在大规模胰腺癌早筛上的创新突破,阿里达摩院(湖畔实验室)医疗AI入选科学与医疗领域的年度亮点研究(High...

关键字: AI 人工智能 集成电路

4月17日消息,去年,中国大陆的半导体设备支出约占据了全球总额的三分之一。

关键字: 半导体 传感器 人工智能 电动汽车

该实验室的创新技术能够增强人工智能边缘解决方案,提高神经网络能力

关键字: 人工智能 神经网络

机器学习作为人工智能领域的重要组成部分,其过程涉及到多个核心环节。本文将详细阐述机器学习的四个主要步骤:数据准备、模型选择、模型训练与评估,以及模型部署与应用,以揭示机器学习从数据到应用的完整流程。

关键字: 数据 人工智能 机器学习

随着信息技术的迅猛发展和大数据时代的到来,机器学习成为了人工智能领域中的核心技术之一。机器学习是通过模拟人类学习行为,使计算机系统能够从数据中自动发现规律、提取特征并进行预测和决策的过程。它在诸多领域取得了广泛的应用,包...

关键字: 计算机 人工智能 机器学习

机器学习算法是人工智能领域中的核心技术之一,它通过对大量数据进行学习,自动发现数据中的规律和模式,从而实现对新数据的预测、分类、聚类等任务。本文将深入探讨机器学习算法的基本过程,包括数据准备、模型选择、训练与评估等关键步...

关键字: 数据 人工智能 机器学习

机器学习是人工智能领域的一个重要分支,它使用各种算法来使计算机系统能够从数据中学习和改进,而无需进行明确的编程。在机器学习的广阔领域中,有多种算法被广泛应用,每种算法都有其独特的适用场景和优势。本文将详细介绍机器学习中的...

关键字: 机器学习 人工智能 计算机

尼得科株式会社将扩大其位于泰国的服务器用水冷模块CDU(Coolant Distribution Unit)生产线,计划在目前的月产能200 台基础上于 2024 年 6 月增加到每月 2,000 台。

关键字: 人工智能 电源 电路板

随着大数据时代的到来和计算能力的不断提升,机器学习作为人工智能领域的重要分支,正逐渐改变我们的生活方式和工作模式。机器学习涉及多个学科的理论和技术,其应用广泛且深入,为各个领域的发展带来了前所未有的机遇。那么,机器学习具...

关键字: 大数据 机器学习 人工智能
关闭
关闭