当前位置:首页 > 智能硬件 > 人工智能AI
[导读]   是不是还在纠结网上的各类技术代名词,是不是都觉得十分的相似,为了理解这些术语有什么不同,你需要了解一些关于机器学习的术语,比如梯度下降,以帮助你理解。   梯度下降   这是

  是不是还在纠结网上的各类技术代名词,是不是都觉得十分的相似,为了理解这些术语有什么不同,你需要了解一些关于机器学习的术语,比如梯度下降,以帮助你理解。

  梯度下降

  这是一个在机器学习中用于寻找最佳结果(曲线的最小值)的迭代优化算法。

  梯度的含义是斜率或者斜坡的倾斜度。

  下降的含义是代价函数的下降。

  算法是迭代的,意思是需要多次使用算法获取结果,以得到最优化结果。梯度下降的迭代性质能使欠拟合的图示演化以获得对数据的最佳拟合。

  

  梯度下降中有一个称为学习率的参量。如上图左所示,刚开始学习率更大,因此下降步长更大。随着点下降,学习率变得越来越小,从而下降步长也变小。同时,代价函数也在减小,或者说代价在减小,有时候也称为损失函数或者损失,两者都是一样的。(损失/代价的减小是一件好事)

  只有在数据很庞大的时候(在机器学习中,几乎任何时候都是),我们才需要使用 epochs,batch size,迭代这些术语,在这种情况下,一次性将数据输入计算机是不可能的。因此,为了解决这个问题,我们需要把数据分成小块,一块一块的传递给计算机,在每一步的末端更新神经网络的权重,拟合给定的数据。

  EPOCHS

  当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一个 epoch。

  然而,当一个 epoch 对于计算机而言太庞大的时候,就需要把它分成多个小块。

  为什么要使用多于一个 epoch?

  我知道这刚开始听起来会很奇怪,在神经网络中传递完整的数据集一次是不够的,而且我们需要将完整的数据集在同样的神经网络中传递多次。但是请记住,我们使用的是有限的数据集,并且我们使用一个迭代过程即梯度下降,优化学习过程和图示。因此仅仅更新权重一次或者说使用一个 epoch 是不够的。

  

  随着 epoch 数量增加,神经网络中的权重的更新次数也增加,曲线从欠拟合变得过拟合。

  那么,几个 epoch 才是合适的呢?

  不幸的是,这个问题并没有正确的答案。对于不同的数据集,答案是不一样的。但是数据的多样性会影响合适的 epoch 的数量。比如,只有黑色的猫的数据集,以及有各种颜色的猫的数据集。

  BATCH SIZE

  一个 batch 中的样本总数。记住:batch size 和 number of batches 是不同的。

  BATCH 是什么?

  在不能将数据一次性通过神经网络的时候,就需要将数据集分成几个 batch。

  正如将这篇文章分成几个部分,如介绍、梯度下降、Epoch、Batch size 和迭代,从而使文章更容易阅读和理解。

  迭代

  理解迭代,只需要知道乘法表或者一个计算器就可以了。迭代是 batch 需要完成一个 epoch 的次数。记住:在一个 epoch 中,batch 数和迭代数是相等的。

  比如对于一个有 2000 个训练样本的数据集。将 2000 个样本分成大小为 500 的 batch,那么完成一个 epoch 需要 4 个 iteraTIon。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

● Arm® 终端计算子系统(CSS)作为新的计算解决方案,结合了Armv9架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新Arm CPU和GPU实现,可赋能芯片合作伙伴快速创新,并加快产品上市进程。 ●...

关键字: AI 人工智能

高性能存储最远可以出现在什么地方?对于铠侠而言,从遥远的太空,到身边的手机、家电,几乎所有智能化设备与存储息息相关,特别随着各行各业对存储需求不断增多,存储容量和性能变得更为重要。

关键字: 存储 物联网 人工智能

5月30日消息,据媒体报道,日本经济产业省近日宣布,将在半导体、先进电子零部件、蓄电池、机床及工业机器人、飞机零部件等五大关键产业领域实施更为严格的监管措施,以遏制技术外泄风险。

关键字: 半导体 传感器 人工智能 电动汽车

5月26日,华为ICT大赛2023-2024全球总决赛闭幕式暨颁奖典礼在深圳举行。本届大赛为华为历届最大规模的线下比赛,共吸引了全球80多个国家和地区、2000多所院校、17万余名学生报名参赛,经过国家赛、区域赛层层选拔...

关键字: ICT 华为 大赛 人工智能

近日,整数智能与浪潮信息签署元脑生态战略合作协议。双方将秉持协同共生、开放共赢的原则,在元脑生态的框架内开展AI与数据科学领域的深度协作,共同为各行业提供更安全高效的数据管理平台,用智能标注助力数据生产的低成本、高精度、...

关键字: 自动化 人工智能 元脑生态

2024年5月25日,上海市欧美同学会长宁分会与曼彻斯特大学中国中心以"智能向善 AI for good"为主题,联合举办了"第二届人工智能论坛"。人工智能领域的企业家和专家学者发表主题演讲及参与圆桌论坛,逾百余位海归学...

关键字: 人工智能 AI 大语言模型

进入人工智能时代,数据重要性进一步凸显。今年,国家数据局等17部门联合印发的《"数据要素x"三年行动计划》指出,要以数据驱动发现新规律、创造新知识,加速科学研究范式变革。北京材料基因工程高精尖创新中心在浪潮信息助力下,通...

关键字: 新材料 数据中心 人工智能

2024年5月28日,中国上海 —— 今日,备受瞩目的Keysight World Tech Day 2024在上海隆重拉开帷幕。作为是德科技年度盛大的技术交流盛会,它不仅是电子测试测量及相关应用领域最新行业趋势与前沿测...

关键字: 测试测量 人工智能 新能源汽车

加利福尼亚州 坎贝尔 – 2024 年 5月 21 日 – Arteris, Inc.(纳斯达克股票代码:AIP)是一家领先的系统 IP 供应商,致力于加速片上系统(SoC)的创建,晶心科技(台湾证券交易所股票代码:65...

关键字: 片上系统 RISC-V 人工智能

5月23日消息,近日在澳门举行的BEYOND国际科技创新博览会上,科大讯飞董事长刘庆峰表示,中美在通用大模型底座上的差距,是半年到一年半之间的动态追赶,不会被甩开。

关键字: 科大讯飞 人工智能 AI
关闭
关闭