当前位置:首页 > 厂商动态 > 亚马逊云科技
[导读]北京——2022年9月14日,日前,亚马逊云科技为其机器学习数据标注服务Amazon SageMaker Ground Truth新增合成数据(图像)生成功能。客户使用这一新功能,可以生成数十万计已标注的合成图像,无需手动标注数据,提高标注的准确性,并快速获取高质量的训练数据集。该功能的推出让Amazon SageMaker变得更强大,作为亚马逊云科技机器学习服务层面的核心产品,亚马逊云科技不断丰富Amazon SageMaker的功能,仅2021年就推出60多项新的特性和功能。


北京——2022年9月14日,日前,亚马逊云科技为其机器学习数据标注服务Amazon SageMaker Ground Truth新增合成数据(图像)生成功能。客户使用这一新功能,可以生成数十万计已标注的合成图像,无需手动标注数据,提高标注的准确性,并快速获取高质量的训练数据集。该功能的推出让Amazon SageMaker变得更强大,作为亚马逊云科技机器学习服务层面的核心产品,亚马逊云科技不断丰富Amazon SageMaker的功能,仅2021年就推出60多项新的特性和功能。

机器学习(ML)模型构建是一个不断重复、迭代的过程,从数据收集和准备开始,然后是模型训练和部署。其中,为模型训练收集大量、多样化且准确标注的数据集,是非常具有挑战性并耗时的第一步。

以计算机视觉(CV)应用为例,在工业领域,该技术能够改善生产质量、提高仓库管理的自动化水平等,目前已在工业数字化和智能化发挥了关键作用。然而,为训练计算机视觉模型而收集数据的过程既耗时又费力,有时甚至几乎无法完成。为确保模型的准确性,数据科学家可能会花费数月时间,从生产环境中收集数十万张图像,尽可能涵盖数据的所有变化。但在某些情况下,例如,要获取罕见或价格昂贵的产品的缺陷的图像,只有通过故意损坏产品这种极端方式才能实现,这让数据科学家无法从真实数据中找到所有的数据变化。

收集完所有数据后,数据科学家团队还需要准确地标注图像,这又是一项艰巨的任务。手动标注图像进程缓慢且容易出现人为错误;同时,构建自定义标注工具和设置缩放标注操作可能既耗时又昂贵。将真实数据与合成数据相结合是缓解这一挑战的方法之一,让数据科学团队可以创建更完整和平衡的数据集并增加数据的多样性。

亚马逊云科技机器学习数据标注服务Amazon SageMaker Ground Truth,可以让客户创建任何图像数据,包括在现实世界中难以发现和复制的特殊场景数据。客户甚至可以自定义对象和环境的变量,例如反映不同的照明、颜色、纹理、姿势或背景。Amazon SageMaker Ground Truth让数据科学家可以为其正在训练的机器学习模型“量身定制”特定用例。此外,客户还可以选择Amazon SageMaker Ground Truth Plus,借助亚马逊云科技的专家团队创建高质量的训练数据集,无需构建用于标注的应用程序或自行管理标注的人员。

Plus One Robotics是一家物流机器人视觉软件开发商。Plus One Robotics 创始人、首席技术官Shaun Edwards 表示,“随着人力资源的减少以及仓库商品量的激增,客户希望我们能帮助他们处理仓库中千变万化的物品。新入库的商品可能是首次出现,或者只在特定情形下出现。使用合成数据能让我们预先对系统进行训练,以应对现实可能遇到的各种情况。我们使用Amazon SageMaker Ground Truth生成数以万计带标签的、来自不同承运商的逼真物品图像,对物品姿势、位置、甚至贴纸或标签之类的表面变化进行建模。合成图像使我们能够更快地训练性能更好的系统,其完整性和精确性使我们免去繁琐的数据标注和清洗步骤,每天为客户超过100万的运单提供支持。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

双方的合作促成了尖端人工智能视觉解决方案,提高了效率、连通性和成本效益

关键字: 人工智能 智能家居 机器学习

【2024年4月24日,德国慕尼黑讯】英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY)发布全新PSOC™ Edge微控制器(MCU)系列的详细信息,该系列产品的设计针对机器学习(ML)应用进行了优...

关键字: 物联网 机器学习 MCU

全新的专有模型导入功能让客户更轻松地将其专属模型导入到Amazon Bedrock中,从而充分利用Amazon Bedrock的强大功能。全新的模型评估功能使客户能够广泛且便捷地选择完全托管模型,包括RAG优化的新版Am...

关键字: 生成式AI 基础模型 数据

TDK株式会社(东京证券交易所代码:6762)新近推出InvenSense SmartEdgeMLTM解决方案,这是一种先进的边缘机器学习解决方案,为用户提供了在可穿戴设备、可听戴设备、增强现实眼镜、物联网 (IoT)...

关键字: 机器学习 物联网 传感器

北京——2024年4月19日 亚马逊云科技宣布,Meta刚刚发布的两款Llama 3基础模型Llama 3 8B和Llama 3 70B现已在Amazon SageMaker JumpStart中提供。这两款模型是一系列...

关键字: 机器学习 基础模型

2024年4月18日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 很荣幸地宣布与Edge Impulse建立新的全球合作关系。Edge Im...

关键字: 机器学习 MCU CPU

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据

2024年4月17日,中国 – 服务多重电子应用领域、全球排名前列的半导体公司意法半导体(STMicroelectronics,简称ST;纽约证券交易所代码:STM)将在2024年4月25日欧洲证券交易所开盘前公布202...

关键字: 半导体 数据

数据占满我们的电子设备已成常态,为了满足广大用户的需求,NAS应运而生。然而,对于许多普通用户来说,NAS设备的设置和使用却常常令人望而却步。不过,铁威马TOS 6的出现,不仅功能强大,而且操作简便,即使是初次接触NAS...

关键字: 数据 电子设备 NAS

机器学习作为人工智能领域的重要组成部分,其过程涉及到多个核心环节。本文将详细阐述机器学习的四个主要步骤:数据准备、模型选择、模型训练与评估,以及模型部署与应用,以揭示机器学习从数据到应用的完整流程。

关键字: 数据 人工智能 机器学习
关闭