tegra平台


英伟达Tegra X1:超乎想象的汽车芯

2015年1月9日,作者:顾杰

老黄(指英伟达CEO黄仁勋)一出手,就知有没有。这次CES 2015,英伟达带来的惊喜可谓是重量级。

几乎没有任何预兆,英伟达毫无征兆地发布了全新一代Tegra芯片架构——Tegra X1,惊掉了所有人的下巴。如果说Tegra K1这么快就被取代已经足够震撼,那么更令人意外的是:Tegra X1的目标市场已经不再是移动设备了。

Tegra X1依然延续了ARM CPU+NVIDIA GPU的SoC架构,但内核却大不相同。CPU部分没有采用NVIDIA自研的Denver架构,而是采用了类似Big-Little设计的八核心A57+A53组合。GPU方面更是直接用上了Maxwell架构,集成两组全新SMM单元,共计256个流处理器,理论运算能力突破1T Flops(FP16)。无论处理能力还是能耗比,Tegra X1相较Tegra K1都有了跨越式提升。

Tegra架构发展历程

工艺制程方面也让人眼前一亮。在桌面级芯片还在使用28nm工艺的背景下,Tegra X1大胆采用了台积电20nm工艺,在保证功耗和发热可控的也缩小了芯片尺寸。

Tegra X1芯片架构

Tegra X1的芯片设计处处彰显着NVIDIA的独门绝技。例如,CPU部分采用了完全一致的缓存架构,不同于传统的Big-Little设计。这不仅大幅提高了缓存效率和利用率,也为所有核心间的任务切换提供了更流畅的共享机制。Tegra X1的CPU不会像普通Big-Little架构那样出现任务切换时的性能损失和限制,从而获得更优秀的性能和功耗表现,同时也降低了编程和优化的难度。

Tegra X1 核心特性

NVIDIA还采用了许多独创的新技术,包括用来替代ARM CCI-400的定制互联系统,以及用于控制芯片节能和加速过程的EDP系统。官方数据显示,Tegra X1的性能明显优于三星Exynos 5433,每瓦性能是后者的1.4倍。这种差异主要来自于NVIDIA在台积电20nm工艺上的优化,而非线程管理方面的不同。

Tegra X1 能耗特性

除了CPU和GPU架构外,Tegra X1在内存和外部输出能力方面相较Tegra K1也有显著提升。内存接口从32位LPDDR3升级到64位LPDDR4,极限带宽从14.9GB/s提升到25.6GB/s,功耗效率提升40%。最高支持分辨率从60Hz的32002000提升到60Hz的38402160(4K),并支持VESA流压缩和H.265解码。Tegra X1还支持HDMI 2.0和HDCP 2.2,这意味着它可以连接刷新率高达60Hz的4K显示器,而Tegra K1最高只支持30Hz刷新率的4K显示。

丰富的接口、强大的运算能力、理想的效率和更优秀的可编程性,Tegra X1的各方面表现都令人期待。那么,究竟谁才是这款芯片的最终受益者?答案也许和Tegra X1的横空出世一样出人意料——新一代Tegra芯片的目标市场并非移动设备,而是汽车领域。