当前位置:首页 > 智能硬件 > 智能硬件
[导读]处理器将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对Tachyum推出的处理器的相关情况以及信息有所认识和了解,详细内容如下。

处理器将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对Tachyum推出的处理器的相关情况以及信息有所认识和了解,详细内容如下。

2016年成立的硅谷芯片公司Tachyum近日发布了一颗神奇的处理器,拥有超多核心、超高频率,功耗却非常低。

这颗处理器名为“Prodigy T16128”,号称全球第一颗“通用处理器”(universal processor),在单一硅片内集成了通用处理器、HPC高性能计算、AI人工智能、DML深度机器学习、可解释人工智能(Explainable AI)、生物人工智能(Bio AI)等不同模块,可简化编程模型和环境。

它拥有多达128个核心,64位,乱序执行,每时钟周期4个指令,每个核心有两个1024位矢量单元、一个4096位矩阵单元,支持虚拟化和高级RAS。

具体架构没披露,不知道是ARM、MIPS还是自研,但强调除了原生指令集,也可以跑x86、ARM、RISC-V,简直全能。

更惊人的是频率,可以轻松超过5GHz,最高达到5.7GHz。

官方宣称HPC算力90TFlops(每秒90万亿次),AI训练和推理算力高达12PFlops(每秒1.2亿亿次),相当于NVIDIA A100的2.4倍,并支持各种数据类型如FP64、FP32、TF32、BF16、Int8、FP8、TAI。

缓存具备64KB一级数据、64KB一级指令、128MB二三级,都支持ECC。

内存支持16通道的DDR5,最高频率7200MHz,单路最大容量8TB。

扩展链接支持64条PCIe 5.0,还有两个400G以太网接口。

制造工艺是5nm(估计台积电),64×84mm FCLGA封装,不算很庞大。

它还支持双路、四路并行,四路的话就是512核心、32TB DDR5内存、256条PCIe 5.0。

官方宣称,该处理器性能优于Intel至强(没有具体对比型号),但功耗仅有十分之一,单位性能售价也只有三分之一。

如果不需要128核心,同时也会有64核心的T864、32核心的T832不同版本,其他规格也有所简化。

Tachyum 将 Prodigy 称为世界上第一个“通用处理器”,并表示它从一开始就被设计为能够运行众多世界上最密集的计算应用程序的多用途 CPU。Prodigy 不仅在单个芯片上处理所有这些不同的任务,而且它的功耗预算比传统硬件低10 倍,成本只有三分之一。

Tachyum 大胆宣称 Prodigy 超级计算机芯片的性能是市场上英特尔最快的 Xeon芯片的四倍,在高性能计算应用中的原始性能是Nvidia 的 H100的三倍。同时,能效提高 10 倍。

Tachyum 表示,为了在单核架构中创造如此令人印象深刻的性能,它从头开始构建了具有矩阵和矢量处理能力的 Prodigy,而不是事后才考虑它们。Prodigy 支持一系列数据类型,包括 FP64、FP32、TF32、BF16、Int8、FP8 和 TAI,所有这些都来自各个 CPU 内核本身。

Prodigy 处理器在 2023 年问世时可能会改变游戏规则。AMD、英特尔和 Nvidia 的最新服务器硬件都依赖于单个硬件——即使在单个 CPU 或 GPU 中——来执行这些不同的工作负载。这方面的一个例子是 Nvidia 的 RTX 系列 GPU ,它需要专用的机器学习 Tensor 核心才能让 AI 工作,而专用的 RT 核心则需要用于光线追踪应用程序。

另一方面,Prodigy 将能够在单个内核上运行 光线追踪 和 AI 应用程序,并且不需要将数据转移到微处理器内部的另一个芯片上。

在单个芯片内运行所有这些不同的 HPC 工作负载可能会极大地改变服务器格局:公司将能够将更多芯片打包到服务器场中,同时降低功耗和冷却。

Prodigy T16128 采用未知来源的 5nm 工艺技术运行,并在非常小的(就其提供的功率而言)64 mm x 84mm FCLGA 封装内运行。

Tachyum 表示,在 HPC 工作负载方面,该芯片能够执行12 AI PetaFLOPS 和 90 TeraFLOPS。Prodigy芯片还可以运行适用于 x86、ARM、RISC-V 和 ISA 的二进制文件。从某种角度来看,单个 Nvidia A100 只能实现 5 AI PetaFLOPS。

每个内核特别能够执行 2 个 1024 位向量单元、4096 位矩阵运算和每个时钟 4 个乱序指令。还支持虚拟化和高级 RAS。该芯片还包括超过 128MB 的具有纠错功能的 L2+L3 高速缓存。为了满足其所有内核的需求,该芯片配备了 16 个 DDR5 内存控制器,额定速度高达 7200MT/s,每个插槽的最大容量为 8TB。

T16128 是 Tachyum Prodigy 系列中的旗舰型号,产品堆栈中的中端和入门级插槽分别由 64 核 T864 和 32 核 T832填充。生产将于2023 年开始,因此我们应该会在明年某个时候看到这些芯片的实际基准。

以上便是小编此次想要和大家共同分享的内容,如果你对本文内容感到满意,不妨持续关注我们网站哟。最后,十分感谢大家的阅读,have a nice day!

声明:本文仅代表作者本人观点,不代表本站观点,如有问题请联系站方处理。
换一批
延伸阅读

上海灵动微电子股份有限公司(以下简称“灵动微电子)联合安谋科技发布高性能MM32F5系列MCU产品。此款产品在架构和外设设计上做了多处创新以适应高端应用市场。

关键字: 灵动微电子 MCU 处理器

5月18日,腾讯控股发布了2022财年Q1季度财报,营收1355亿元人民币,同比持平,毛利570.74亿元,同比减少9%,调整后净利润255亿元人民币,同比下降23%。

关键字: 腾讯 财报 服务器 处理器

Shanghai, China, 18 May, 2022 * * * 嵌入式和边缘计算技术的领先供应商德国康佳特宣布,其基于恩智浦(NXP) i.MX8 M Plus处理器的SMARC计算机模块已在Arm发起的Proj...

关键字: 康佳特 处理器 边缘计算

(全球TMT2022年5月17日讯)技嘉科技宣布旗下专为电竞玩家设计的AORUS系列产品,包括Z690 AORUS XTREME WATERFORCE等三款高端主板及AORUS FO48U电竞显示器,在2022年iF设...

关键字: FORCE 处理器 RF 电竞显示器

台北2022年5月16日 /美通社/ -- 继获得红点设计奖的肯定之后,技嘉科技今日再传捷报,宣布旗下专为电竞玩家设计的AORUS系列产品,包括Z690 AORUS XTREME WATERFORCE等三款高端主板及AO...

关键字: FORCE WATER 处理器 RF

(全球TMT2022年5月13日讯)经 IRIS 认证的铁路通讯解决方案提供商 Moxa 推出面向轨旁和道路移动应用的全新 V2403C 系列。作为一款即用型解决方案,V2403C 计算机搭载英特尔®酷睿™...

关键字: MARK 计算机 BSP 处理器

本文中,小编将对TI德州仪器的DRA78x系列处理器予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 处理器 DRA78x TI

即将到来的AMD Zen 4将是庞大的5nm家族。

关键字: 5nm AMD 处理器 锐龙7000

加利福尼亚,圣克拉拉 – 2022年5月4日 – 豪威集团,全球排名前列的先进数字成像、模拟、触屏和显示技术等半导体解决方案开发商,当日发布用于汽车行业的高级人工智能专用集成电路(ASIC),该产品能以无缝方式同时为专用...

关键字: 豪威集团 处理器 人工智能

编辑精选

技术子站

关闭