Mon - Fri: 10am - 5pm
+86+86 186 7944 5240
Home- Blog- Blog Details
中昊芯英近日推出了其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力达到了 896 TFLOPS,性能较上一代「刹那」芯片提升了三倍。在 8-bit 推理方面,算力高达 1792 TOPS,能够满足大规模词元并发推理的需求。与上一代相比,「须臾」在显存容量和芯片内部互联速率上均有显著增强,并支持超长上下文处理。该芯片的额定功耗为 600W,相较于传统算力芯片,功耗降低了 50%,有助于推动低碳数据中心的建设。
「须臾」芯片在 IP 核、专属指令集、底层算子加速库以及整机系统软件等方面均由中昊芯英自主研发,不依赖任何海外核心技术,因此能够满足政务、金融、电网等行业在安全合规方面的要求。
同期发布的「泰则 2.0」高性能智算平台,作为标准化的最小计算单元,集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元。该平台以一台通用 CPU 服务器外接一台高性能 TPU 算力加速设备的形式呈现,其总算力可达 7.168 PFLOPS(混合精度),在执行相同任务时,整机能耗仅为传统 GPU 服务器的八成。
在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具,并在训练场景下适配 DeepSpeed、Megatron-LM 等分布式套件。该平台已深度适配了 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言及多模态模型,使开发者能够高效地完成模型迁移工作。对于关注未来科技进展的爱好者来说,了解这些高性能计算设备的发布,或许能从侧面窥见未来某些大型体育赛事的直播和数据分析的潜力,尽管具体的 世界杯赛程 尚未公布,但计算能力的飞跃无疑为各类复杂应用奠定了基础。
October, 2016
October, 2018