当前位置:首页 > 嵌入式 > 嵌入式软件
[导读]今年 3 月,苹果发布了其自研 M1 芯片的最终型号 M1 Ultra,它由 1140 亿个晶体管组成,是有史以来个人计算机中最大的数字。苹果宣称只需 1/3 的功耗,M1 Ultra 就可以实现比桌面级 GPU RTX 3090 更高的性能。

今年 3 月,苹果发布了其自研 M1 芯片的最终型号 M1 Ultra,它由 1140 亿个晶体管组成,是有史以来个人计算机中最大的数字。苹果宣称只需 1/3 的功耗,M1 Ultra 就可以实现比桌面级 GPU RTX 3090 更高的性能。

随着用户数量的增长,人们已经逐渐接受使用 M1 芯片的计算机,但作为一款 ARM 架构芯片,还有人在担心部分任务的兼容性问题。昨天,通过与苹果 Metal 团队工程师合作,PyTorch 官方宣布已正式支持在 M1 版本的 Mac 上进行 GPU 加速的 PyTorch 机器学习模型训练。此前,Mac 上的 PyTorch 训练仅能利用 CPU,但随着即将发布的 PyTorch v1.12 版本,开发和研究人员可以利用苹果 GPU 大幅度加快模型训练。现在,人们可以在 Mac 上相对高效地执行机器学习工作,例如在本地进行原型设计和微调。苹果芯片的 AI 训练优势PyTorch GPU 训练加速是使用苹果 Metal PeRFormance Shaders ( MPS ) 作为后端来实现的。MPS 后端扩展了 PyTorch 框架,提供了在 Mac 上设置和运行操作的脚本和功能。MPS 使用针对每个 Metal GPU 系列的独特特性进行微调的内核能力来优化计算性能。新设备将机器学习计算图和原语映射到 MPS Graph 框架和 MPS 提供的调整内核上。

PyTorch的前身是Torch,其底层和框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。它是由Torch7团队开发,是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络。PyTorch既可以看作加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。除了Facebook外,它已经被Twitter、CMU和Salesforce等机构采用。

M1 Ultra将两个M1 Max芯片融合在一起,组成了一个具有20个CPU核和64个GPU核的处理器,以及高达128GB的RAM,这是我们测试过的速度最快的处理器之一。随着 Mac Studio 的推出,苹果还发布了全新的 Apple Silicon 芯片 M1 Ultra。这实际上是将两个 M1 Max 芯片合二为一。Geekbench 测试显示它比 Intel Mac Pro 中提供的最高规格 CPU 更强大时,我们初步了解到 M1 Ultra 芯片的强大程度。 “28 核 Intel Xeon W-3275M 处理器是 Mac Pro 中最好的处理器,多核得分为 19951。这意味着 M1 Ultra 比英特尔 Mac Pro 可用的最昂贵的 CPU 快约 20%。”Macworld 运行了一组非常全面的基准测试,这表明高端芯片的优势差异很大,ProRes 摄像师看到了最大的改进。 “如果你对 ProRes 和 H.265 等视频编解码器很感兴趣,那么拥有双倍于 Ultra 中的加速器将带来巨大的性能提升。如果你关心照片编辑器,那么两种型号的单核性能几乎相同,这意味着可以选择更便宜的版本。但是,如果你确实需要进行较重的照片工作,Ultra 的更高内存限制可以派上用场。再次,认识到你的工作流程需要什么,然后做出相应的选择。”

一般认为,苹果的UltraFusion封装架构是基于台积电(TSMC)的CoWoS(Chip-on-Wafer-on-Substrate),这是一项2.5D封装技术,可以将多个小芯片封装到一个基板上。不过半导体封装方面的专业人士Tom Wassick则放出了相关的幻灯片,显示M1 Ultra采用的是名为“InFO_LI”的封裝方式,属于本地芯片互联的晶圆级封装。

此前在春季发布会上,苹果并没有更新自家的笔记本产品线,而是“另起炉灶”推出了Mac Studio产品线,以替代此前设计稍显过时的Mac Mini。芯片方面,Mac Studio采用的是将两颗M1 Max“缝合”在一起的M1 Ultra芯片。那么在此后的WWDC 2022上,有业内人士预测M2芯片将有极大可能正式亮相,并且实装在全新的MacBook Air上。

同时,MacBook Air也将会更换全新的模具,并且像此前的M1 iMac一样,拥有更多的配色。M2还将会可能被应用在入门款的MacBook Pro和iMac系列产品上,这两类产品也将有可能在WWDCC 2022上迎来更新。不知道,新的M2芯片,什么时候能被Torch兼容呢?这样,Mac的优势就更大了。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

今天,小编将在这篇文章中为大家带来机器学习的有关报道,通过阅读这篇文章,大家可以对它具备清晰的认识,主要内容如下。

关键字: 机器学习 TensorFlow PyTorch

3月20日消息,全球最强AI芯片GB200横空出世,使得这届GTC 2024大会热度空前,也让英伟达创始人兼CEO黄仁勋再一次成为全球焦点人物。

关键字: 英伟达 GPU 芯片

The Weather Company 和台湾气象部门成为首批采用全新 Earth-2 云 API 的机构,使用 AI 加速全球气候和天气高分辨率模拟和可视化,突破性地实现 2 公里尺度

关键字: AI 数字孪生 GPU

3月19日消息,在英伟达年度 GTC 开发者大会上,黄仁勋宣布推出推出了Project GR00T人型机器人项目,其中就包括全球首款人型机器人基础模型。

关键字: 英伟达 GPU 芯片

3月19日消息,在英伟达GTC 2024大会上,英伟达CEO黄仁勋宣布推出新一代GPU Blackwell。

关键字: 英伟达 GPU 芯片

基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过 NVIDIA NVLink可将多达 576 块 Blackwell...

关键字: 生成式 AI 超级计算 GPU

NVIDIA cuLitho 可将半导体制造中高度计算密集型的工作负载加快 40-60 倍,并为业界带来全新的生成式 AI 算法

关键字: 生成式 AI 半导体 GPU

全新 NVIDIA NIM 和 GPU 加速的微服务专为生物、化学、影像和医疗数据开发,并在 NVIDIA DGX 云中运行

关键字: 生成式 AI GPU 数字医疗

Meta日前推出两个功能强大的GPU集群,用于支持下一代生成式AI模型的训练,包括即将推出的Llama 3。

关键字: Meta 英伟达 H100 GPU

3月14日消息,从年初到现在,英伟达的股价已经飙升了80%,在过去一年内上涨了287%,其股价已经逼近1000美元关口,市值达到了2.2万亿美元逼近苹果公司。

关键字: 英伟达 GPU 芯片
关闭