宣称每美元、每瓦 Token 可达英伟达 Rubin 五倍,Positron 公布 AI 推理芯片 Asimov

内容摘要IT之家 2 月 5 日消息,AI 推理芯片初创企业 Positron 当地时间公布了其第二代 ASIC 设计 Asimov,宣称该产品的 Token 能效与性价比都可以达到英伟达 Rubin GPU 的五倍。Positron 表示 Tra

IT之家 2 月 5 日消息,AI 推理芯片初创企业 Positron 当地时间公布了其第二代 ASIC 设计 Asimov,宣称该产品的 Token 能效与性价比都可以达到英伟达 Rubin GPU 的五倍。

Positron 表示 Transformer 推理运行的限制在内存而非算力,因此 Asimov 在设计上就是以内存优先,拥有 90% 的内存带宽利用率,并从结构上消除不必要的远程数据移动。

Asimov 芯片由一对计算模块组成,内置支持多样化数据格式的脉动阵列。每个计算模块连接到 432GB 的 LPDDR5x 内存,并通过 PCIe 6.0 / CXL 3.0 连接到至多 720GB 的 KV Cache 缓存用内存。其芯片整体 TDP 为 400W,内存总容量 2304GB、总带宽 2.76 TB/s,支持风冷冷却。

Positron Asimov 支持多样化拓扑结构的 16Tbps 芯片间互联。其 Titan 推理服务器系统采用 19 英寸 4U 机架规格,聚合了 4 颗 Asimov 芯片,支持 16T 参数模型推理和 10M 上下文窗口,单系统最多 4096 套 Titan。

Positron 表示 Asimov 芯片目标在 2026 年底完成芯片流片,并在 2027 年初投入生产。

宣称每美元、每瓦 Token 可达英伟达 Rubin 五倍,Positron 公布 AI 推理芯片 Asimov  
宣称每美元、每瓦 Token 可达英伟达 Rubin 五倍,Positron 公布 AI 推理芯片 Asimov  
宣称每美元、每瓦 Token 可达英伟达 Rubin 五倍,Positron 公布 AI 推理芯片 Asimov  
宣称每美元、每瓦 Token 可达英伟达 Rubin 五倍,Positron 公布 AI 推理芯片 Asimov
 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐