澳门游戏平台大全 电子游戏平台 电子游戏平台二种分裂的Cortex,外国媒体anandtech深入分析HUAWEI海思麒麟980

电子游戏平台二种分裂的Cortex,外国媒体anandtech深入分析HUAWEI海思麒麟980



IT之家11月7日消息
麒麟980是全球首款商用的、采用台积电7nm制造工艺的处理器,是首款支持
2133MHz LPDDR4X内存的处理器,是Cortex-A76架构CPU、Mali-G76
GPU的全球首发商用。此外,麒麟980搭载世界首枚双NPU,并在全球率先支持LTE
Cat.21。

原标题:外媒anandtech分析华为海思麒麟980

现在,ChipRebel为我们带来了高分辨率的麒麟980的微观设计结构拍摄图,我们来看一下,华为最新旗舰芯片麒麟980的微观世界是什么样子的。

海思半导体推出麒麟980:7nm的首款A76,G76

麒麟980芯片的实际大小仅74.13mm²,这比去年麒麟970的96.72mm²相比,体积减少了30%。外媒对麒麟980处理器的微观照片加了一些标签,方便大家观看。

Andrei Frumusanu
于2018年8月31日美国东部时间上午8:30

在上图左上角,我们可以看到新的Mali G76 MP10 GPU,Mali
G76不同于上一代的GPU,它基本上使每个核心的计算能力翻了一番。实际上,我们可以理解为MP10核心配置相当于上一代MP20改进。

电子游戏平台 1

在上图的右边,是麒麟980芯片的CPU,这是海思的第一个DynamIQ
CPU配置。麒麟980芯片充分利用了DynamIQ的灵活性,并附加了不同的CPU。

今年在IFA,华为首席执行官余承东在公司的主题演讲中宣布了今年新款的麒麟980
,而不是让我们突然在展会上找到新的芯片。对于那些过去几个月一直关注我们文章的读者来说,今天的新闻应该不会出现太大的意外,因为我一直在暗示第一批新的7nm
Cortex
A76芯片将在稍后出现。今年在商用设备领域,HiSilicon成为新一代SoC市场上第一个市场供应者。

中间区域是DSU、DynamIQ共享单元,其本质是三级缓存和tag
RAM以及大的4MB三级缓存。在DSU的两侧,我们可以看到4个Cortex-A55内核,其主频高达1.8GHz,每个内核都有128KB的二级缓存。

华为的半导体设计部门——海思半导体,一直是该公司产品的关键战略组成部分,因为它比我们通常看到:仅仅依赖于高通等成熟的开放式SoC供应商;能够以更为激烈的方式实现差异化。

在图中,我们可以看到两对Cortex-A76。海思将这4个核心组成一对,每一对都在一个专用的电压和频率平面上运行。需要注意的是,这两对Cortex-A76之间的物理排版明显不同,目前不清楚这样做的目的。

这种策略当然是一把双刃剑,就好像你全押宝在你内部消化的芯片一样,这也意味着这些设计必须正确执行,否则你会发现自己处于不利的竞争地位。

有趣的是,在麒麟980的微观照片上很难找到华为宣传的NPU。海思表示这是一个双核单元,但在拍摄中没有找到,应该是华为对这个“核”使用了不相同的布局,以至于在微观图中没有被发现。

麒麟950是一款令人印象深刻的芯片,因为它在当时全新的台积电16FF制造工艺上首次采用了Cortex
A72 –
这为华为带来了丰厚回报,新IP+新制造节点的组合,使得它极具竞争力。

另一方面,麒麟960和麒麟970展示了这一策略的风险,并且事情可能偏离轨道

麒麟960是一款16nm
SoC,当它发布时,10nm的竞争对手如Snapdragon 835和Exynos
8895占主导地位。

当切换到10nm制造节点时,麒麟970表现更好,但这次HiSilicon没有采用最新的ARM
CPU IP设计,而依赖于于A73 CPU,Snapdragon 845则采用了新的A75。

此外,最近两代麒麟表现出极其缺乏竞争力的GPU性能和效率数据

电子游戏平台,在这里HiSilicon陷入困境,这应该是IP供应商能够与高通等市场领导者进行竞争性设计的能力。

我之所以重申最近几代发生的事情,是因为此次HiSilicon发现自己处于一个非常有利的位置,在这个位置上,IP和制造业已经融入了新设计,达到最佳情况。

ARM的新款Cortex A76和Mali
G76在性能和功效方面都有飞跃,而台积电正在大规模生产其新的7nm芯片。

新款麒麟980,首款推出的台积电7nm
SoC以及首款Cortex A76和Mali G76设计:

电子游戏平台 2

新的Kirin
980思索了ARM的所有最新可用IP之后,最终采用了——4个Cortex A76和4个Cortex
A55组成的DynamIQ CPU集群配置。

今天对我来说最大的惊喜,是看到HiSilicon已经向前迈进了一步,充分利用了ARM的新DSU集群及其异步CPU配置,实际上全新的Cortex
A76被分为两组,每组都有自己的时钟和电压。

电子游戏平台 3

性能最高的Cortex
A76运行速度高达2.6GHz。

这比ARM最初公布的CPU的3GHz目标要低,但是我曾警告读者,表示应该期望在2.5GHz附近采用更保守的频率,因为更高的频率似乎意味着更高的TDP(热设计功耗)。

尽管如此,新的CPU架构仍然带来了显着的性能改进,在2.6GHz仍然表现非常出色,为这一代带来领先的性能。

令人惊讶的是,第二集群的Cortex
A76核心运行频率高达1.92GHz,对电源效率来说是绝佳消息。在这里,我们看到一个“中等”效率CPU组。

由于这两个内核在与高性能集群的A76在分开的时钟和电压平面上运行,这意味着它们可以在不同的效率点运行,从而在各种多线程操作中更有效的节省功耗。

以前,四核集群运行在相同的时钟和电压上,如果有一个高性能线程需要高性能状态,这意味着其他中等性能线程被迫进行不必要的运行,导致功率效率下降。

这种效率较低的性能状态,通过引入中间层,有效地消除了这种在实际应用中常见的开销。

到目前为止,我还没有能够与HiSilicon证实这一点,但是这个中等性能的双核A76的时钟减少也会强烈指出可能不同的物理实现具有较低的硅签核频率(???)。这意味着即使两对A76都是相同的IP,这个中间集群在以相同频率运行时实际上更有效。

最后,我们看到四个新的Cortex
A55内核是SoC中最节能的主力核心,它们能够承受高达1.8GHz的工作负载。此外,凭借中等性能集群,HiSilicon可能能够为A55实现很高的功耗效率,从而使频率在当前的A53和A55
SoC范围内。

缓存方面,所有Cortex
A76都带有ARM推荐的512KB L2缓存配置,而A55则采用128KB缓存。

提醒一下,在新的DynamIQ群集配置中,这些设计的L2缓存是每个CPU核心专用的。DSU中的L3缓存已完全实现4MB,是我们在Snapdragon
845中看到的两倍。

我无法确定麒麟980中DSU的频率,也没有确定它自己有一个单独的时钟和电压平面,这里可能它可能与A55的同一平面上。

再一次讲下,这只是我的猜测,另一种可能性是980有4个完整的时钟和电压平面用于整个CPU。

与麒麟970相比,CPU性能提高75%,效率提高58%

在性能提升方面,HiSilicon承诺比麒麟970增加75%,我根据ARM声称的性能,经过一些数学运算预测A76实际的性能。

电子游戏平台 4

以下预测属于我自己,并考虑了ARM和HiSilicon的性能声明:

电子游戏平台 5

您可能已经注意到,功率和效率预估也包括在内。

海思半导体宣称,麒麟980的功率效率比麒麟970高58%。

我们无法确认:这是否意味着在970的相同性能或者麒麟980的目标性能下,能效比提高了58%;还是在SoC各自的峰值性能状态下,其性能均优于58%。

该假设假定后者,它实际上再次与ARM
自己关于Cortex A76的吹牛逼相匹配。

电子游戏平台 6

我还是很很怀疑这些数字,因为他们似乎相当惊人;

不过到目前为止,我还没有看到任何实际上会打破这些牛逼的信息。

在我们真正拿到第一台麒麟980设备之前,请考虑上面的功率和效率估算。

电子游戏平台 7

3集群CPU层次结构也带来了调度方面的复杂性。

正如我们今年所见,调度是现代SoC的一个关键,因为它具有非常高的动态性能和功率范围,使用最优解决方案对于SOC至关重要。

在这里,海思承诺推出一种新的“灵活调度”机制。遗憾的是,我们没有更多细节,但它将成为新款麒麟980的重要组成部分。

新Mali-G76 MP10 –
实际算是20个“渲染管道”

麒麟980也是第一款采用ARM新一代Mali G76
GPU的SoC。

G76与过去的Midgard和Bifrost
GPU大不相同,它大大改变了你认为是“核心”的结构。

G76基本上在纹理单位,渲染单位上加倍,并且算术管道的宽度加倍。

实际上,G76核心几乎相当于两个G72核心。

电子游戏平台 8

这意味着,在纸面上,G76
MP10乍一看可能不如麒麟970中的G72
MP12,但它实际上计算资源增加了66%,这还没有考虑到新IP的架构改进。

麒麟970的GPU时钟频率高达747MHz –
但此频率下的功耗对于SoC来说仍然太大,推测实际工作负载可能在在低得多的频率下有效运行(本人注:可能GPU阳痿?)。

麒麟980以720MHz的频率运行新GPU,并将性能提升46%。我们在这里没有任何关于工作量的详细说明,但通常行业标准通常是GFXBench
Manhattan。

性能提高46%,能效比提高178%

新GPU的真正杀伤力,是海思列出一个庞大的对比阵容,相比麒麟970,推断结果是能耗比有
178%的提升:

电子游戏平台 9

至少在这个工作量下,所宣称的性能提升对于Snapdragon
845的Adreno 630来说仍然有点太低了。根据Mali
G76不同的扩展,我们可能会根据不同的测试得出不同的结果,显示重新填充繁重工作负载与算术/计算繁重工作负载的重新平衡。

麒麟980将展示飞跃性的功耗和效率。根据ARM自己的数据,HiSilicon的营销声明最终与我们对G76的预测差不多。

如果跟预期的那样,那将意味着新的麒麟980最终将恢复到麒麟950的可持续功耗(本人注:就是日常阳痿机率变小),从而消除了前两代Bifrost
GPU带给用户的恐惧。

我今年一直在呼吁大家注意可持续性能,我真的希望麒麟980最终接近预测,因为这不仅是SoC的重要一步,也是消费者体验的飞跃。

更快的内存控制器

980采用LPDDR4X内存控制器,虽然它声称是业界第一款运行在2133MHz的芯片,带宽增加了13%。

麒麟970的缺点之一是内存控制器在较高频率下非常耗电,希望新设计解决这些问题,以便高性能状态下的效率更高。

电子游戏平台 10

令人惊讶的是,HiSilicon公布了一些内存延迟和带宽数据:

在GeekBench
4测试中,麒麟980的测试值为138ns,而Snapdragon
845的测量值为176ns。

这实际上有点令人眼花缭乱,因为在上下文中,延迟数字并非全部好的:麒麟970也有类似的138ns延迟,与Snapdragon
835相同。

然而所有这些都比Exynos
9810的78ns更差。

在这里,我希望厂商改造不会限制A76的峰值性能,就像高通公司在S845中增加的新L4系统缓存延迟阻碍了A75核心的性能。

对于Snapdragon 845,带宽数据为23.1GB /
s而不是19.2GB / s。

我被告知GB4的内存带宽测试在某一点之后会出现问题,因此我暂时对这些结果的重视程度不高。

新ISP

麒麟980采用了新的ISP,增加了46%的吞吐量,能够支持更高分辨率的摄像机。

HiSilicon的第一款产品是引入用于HDR捕获的10bit流水线,这一功能也在今年竞争对手SoC中引入,但由于色彩管理和显示的落后,实际上很少使用。

电子游戏平台 11

电子游戏平台 12

新的ISP现在能够使用“多通道降噪”,这听起来很像今年Snapdragon
845中引入的多帧降噪功能,其中噪声降低不是基于空间像素执行,而是基于时间帧间基础,产生更清晰的无噪声图像,没有模糊的副作用。

还有一个新的视频编码管道,承诺在捕获之间“延迟33%”。最后一部分的意义还不清楚

麒麟970缺乏4K60编码功能,而麒麟980是否支持它是我们仍需要与华为澄清的事情。

新的“双NPU”,2倍吞吐量

麒麟980继续改进其神经网络推理加速IP,并推出了新的“双NPU”。

事实上,这意味着该模块已经加倍,就像将缩放单元添加到GPU一样。

该块一次只能处理一个模型内核,这意味着实际上单个推理的速度应该加倍,这取决于NN模型。

电子游戏平台 13

电子游戏平台 14

神ç»?处ç?†å?•å…ƒæ€§èƒ½ –
�为内部数�

据说新单元比麒麟970的NPU快2.2倍,每分钟可实现高达4500次推断,或识图速度达到75
fps。

他们也提供了Snapdragon 845和Apple
A11的数据,根据我自己的测试,这些数据非常准确。

更快的Cat.21基带,速率高达1400Mbps

麒麟980中的新基带提升了功能 –
现在它能够支持高达1400Mpbs的UE Cat 21。

通过4×4
MIMO组合实现高达3倍的载波聚合,同时支持2×2
MIMO和上传链路(类别18)中的新256-QAM,并实现200Mbps上传速度。

台积电7纳米制造工艺,69亿个晶体管分布在小于100mm²的面积上

新芯片组拥有69亿个晶体管 –
与去年的麒麟970相比增长25%,达到55亿个。

由于新的7nm
TSMC工艺节点,HiSilicon能够保持小于100mm²的小芯片面积。

电子游戏平台 15

电子游戏平台 16

该项目于2015年开始,采用7nm工艺节点研究,从2016年开始进行IP单元开发,并于2017年进行验证。

最后,SoC自今年夏季开始大规模生产。

自家的WiFi芯片组

令人惊讶的是,980采用自家新款Hi1103
WiFi芯片组。

新芯片支持802.11ac,速度高达1732Mbps,支持2×2
MIMO和高达160MHz频宽。

我说这是令人惊讶的,因为通常华为会采用博通Broadcom的WIFI芯片,博通的解决方案被认为是行业领先的,并且基本上可以在每个旗舰设备中找到。

新款HiSilicon芯片组的表现如何,这将会是一个很有趣的问题。

群星汇聚麒麟980

麒麟980确实看起来像是一个非常均衡的SoC,在各方面都有重大改进。

麒麟960和970面临的竞争非常激烈,这既是由于工艺节点的劣势,也是由于IP的劣势,两者都因GPU性能和效率不佳而受到很大影响。

而麒麟980希望通过ARM的新Cortex A76
CPU,G76
GPU,内存控制器,ISP和更新后的NPU等新内部IP模块,再加上领先的7nm制造工艺,解决这些问题。

所有这些新特性的结合使新款麒麟980处于极佳的竞争地位,即将推出的Mate
20应该是一款值得期待的设备。返回搜狐,查看更多

责任编辑:

标签:, , , , , , ,

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图