当前位置:首页 > 芯闻号 > 充电吧
[导读]NVIDIA 方面宣布与开源社区达成合作,为 Apache Spark 3.0 带来端到端的 GPU 加速。Apache Spark 3.0 是一种用于大数据处理的分析引擎,目前已被全球超过 500,

NVIDIA 方面宣布与开源社区达成合作,为 Apache Spark 3.0 带来端到端的 GPU 加速。Apache Spark 3.0 是一种用于大数据处理的分析引擎,目前已被全球超过 500,000 名数据科学家所使用。

按照计划,随着 Spark 3.0 于春季晚些时候发布,数据科学家和机器学习工程师将首次能够把革命性的 GPU 加速应用于普遍使用 SQL 数据库操作进行的 ETL(提取、转换和加载)数据处理工作负载中。

此外,AI 模型训练将能够在相同的 Spark 集群上进行处理,而不是将工作负载作为单独的流程在单独的基础架构上运行。这样就可以对整个数据科学的处理流程进行高性能数据分析,对从数据湖到模型训练所涉及的数十、乃至数千 TB 的数据进行加速,而且无需对已被应用于本地和云端 Spark 应用程序的现有代码进行修改。

NVIDIA 企业计算部门负责人 Manuvir Das 表示:“数据分析是当今企业和研究人员面临的最大的高性能计算挑战。” “从 ETL 到培训再到推理,整个 Spark 3.0 方案的原生 GPU 加速为用户提供了最终将大数据潜力与 AI 性能相连所需的性能和规模。”

基于与 NVIDI A的战略 AI 合作关系,Adobe 是最早在 Databricks 上运行 Spark 3.0 预览版的公司之一。Adobe 已在 Adobe Experience Cloud 中使用 GPU 加速数据分析技术进行产品开发,并为各项推进数字化业务进程的功能提供支持。并且在初步测试中,其已将性能提高了 7 倍,以及节省了 90% 的成本。

性能提升后的 Spark 3.0 让科学家能够训练包含有更大数据集的模型,并增加反复训练模型的频率,从而提高模型的精度。现在,数据科学家每天可以处理数TB的新数据,这对于需要为在线推荐系统提供支持或分析新研究数据的数据科学家们而言至关重要。此外,处理速度的加快,减少了交付结果所需的硬件资源,从而节省了大量成本。

Adobe 机器学习高级总监 William Yan 表示:“相比于在 CPU 上运行 Spark,NVIDIA 加速的 Spark 3.0 性能速度得到了大幅提高。伴随着 GPU 性能的飞跃性提升,也将为我们全套 Adobe Experience Cloud 应用中 AI 功能的提升带来新的可能性。”

NVIDIA正在为 Apache Spark 贡献一种新的开源 RAPIDS 加速器,以帮助数据科学家提高其数据流程的端到端性能。该加速器能够将之前需要在 CPU 上运行的功能转到 GPU 上运行,以发挥 GPU 的性能:

在无需更改任何代码的情况下显着提高 Spark SQL 和 DataFrame 的运行性能,从而加速 Spark 中的 ETL 数据流程。

无需独立的机器学习和深度学习集群,即可在相同的基础架构上加速数据准备和模型训练。

加速 Spark 分布式集群中各节点之间的数据传输性能。这些资源库使用 UCF Consortium 的开源 UCX(Unified Communication X)框架,并通过使数据直接在 GPU 内存之间移动来最大程度地减少延迟。

Spark 3.0 预览版下载地址:https://spark.apache.org/downloads.html

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭