苹果A12芯片深度解析:缓存容量翻倍,NPU面积暴增316%!
9月13日,苹果发布了三款新iPhone,与此同时,备受关注的苹果新一代处理器A12也正式曝光。从苹果官方公布的信息来看,A12可谓是非常的强大。那么他性能到底如何,相比华为刚刚发布的麒麟980以及此前的安卓旗舰处理器高通骁龙845又如何呢?
昨日外媒AnandTech发布了一篇关于苹果A12处理器的分析文章。AnandTech还引用了TechInsights对于苹果A12的拆解图,对于苹果A12的内部结构进行了分析,同时,还对A12进行了性能测试,他们认为苹果官方所公布A12性能提升数据偏保守,这颗芯片的实力其实更强。下面我们一起来看:
苹果A12的内部结构更为复杂
除了性能测试之外,AnandTech还引用了TechInsights对于苹果A12的拆解图,对于苹果A12的内部结构进行了分析:
▲A12内部结构图
在上面这张A12内部结构图的最左边是NPU内核,最右边我们可以看到A12的四个GPU核心,中间是被分成四块的系统缓存。A12的六颗CPU内核位于上图的中下部,其中两个Vortex CPU大核在左侧,中间是四块大的二级缓存,右侧下方是四个Tempest CPU小核和它们自己的二级缓存。
▲A11内部结构图
对比苹果A11芯片的内部结构来看,A12的内部设计有了很大的变化。NPU内核放到了最左边,并且在SoC当中所占的面积也大幅增加。苹果声称其NPU已经从A11中的双核设计转变为新的8核设计。由于增加了一个GPU内核,A12的GPU所占的面积也进一步增加。另外,可以看到在A11中的SRAM系统缓存是被分为两块,而A12则分成了四块,这表明这个区块的系统缓存性能发生了很大的变化。
总的来说,苹果A12的内部结构相比以往发生了巨大变化。AnandTech称,A12的系统缓存变化是自A7推出以来最大的变化。
另外,需要补充的是,A12的单个GPU核心面积相比A11减少了37%,显然,新的7nm工艺的加持下,使得A12能够在面积进一步缩小的同时,能够额外增加一颗GPU核心。
NPU面积增加3.16倍,性能暴涨
由于A12采用了新的台积电的7nm工艺,使得A12的晶体管密度得到了大幅的提升,所以从上面这张A12与A11内部各个功能模块的面积数据对比来看,A12虽然性能更强,但是总体Die size比10nm的A11却做到了更小。
A12与A11内部各个功能模块的面积大小数据对比
另外可以看到,在7nm工艺加持下,A12的大小CPU内核、GPU内核的面积比10nm的A11都小,但是A12的NPU内核的面积却达到了5.79mm²,是A11的NPU的面积(1.83mm²)的3.16倍。而NPU内核面积的暴涨,再加上先进工艺的加持使得单位面积下晶体管密度的提升,也直接带来了NPU性能的暴增。
据苹果介绍,A12的NPU内核共有8个核心,具有机器学习、多精度支持功能和智能计算系统。具体在性能上,相对于上一代苹果A11的双核NPU的6000亿次运算/秒的计算能力,苹果A12的NPU每秒可进行5万亿次运算(5TFLOPS),搭配ISP、深度引擎、安全隔区、视频处理器、视频编码器、存储控制器等重要部件,智能化更高。
另外,机器学习(ML,Machine Learning)是Neural Engine最重要的功能之一。苹果A12的CoreML开发库的学习能力是上一代的9倍,但其功耗却只是上一代的1/10。它的智慧化不仅仅体现在Siri功能的灵活多样,还体现在拍摄、AR、游戏(动作追踪和图形渲染等)和Face ID等方面。
有传闻称,苹果A11的NPU内核是基于CEVA的IP,不过这一传闻并未得到证实,因为苹果并不希望外界知晓。
全新的缓存设计
前面提到,A12在系统缓存上有了较大的变化,同时A12的大小核CPU的一级/二级缓存也有了变化。
图片来源:TechInsights Apple A12Die Shot,ChipRebel Apple A11Die Shot
从上图中可以看到,A12 Vortex CPU大核的一级缓存的占比达到了A11的两倍。根据AnandTech的推测,A12的Vortex大核CPU中的一级缓存相比A11也增加了一倍,由64KB增加到了128KB。而Vortex大核CPU的二级缓存则与A11一致。
那么苹果的缓存层次结构到底是什么样的呢?通过查看不同测试深度下的内存延迟行为,可以清楚地看到一级缓存L1从64KB提升到了128KB(是一条直线没有延迟)。不过AnandTech发现一个奇怪的现象,在3MB范围内,时延是缓慢增加的,直到6MB左右。需要注意的是,只有当以完全随机模式访问时,才会出现这种行为,在较小的访问窗口中,时延曲线是平坦的直到6MB,超过6MB则呈现出近乎直线上升的趋势。另外对于系统缓存,AnandTech认为整体的系统缓存不仅片数翻了一番,而且容量也从4MB提高到了8MB。
在CPU小核方面,从测试来看,A11的单个CPU小核可调用的二级缓存似乎被限制在512KB,而A12则上升到了1.5MB。不过,AnandTech这是被缓存的电源管理策略所欺骗了,可以看到A11 Mistral核心延迟,从768KB和1MB处有明显跳跃,而A12核心在2MB处也可以看到类似的跳跃。实际上,A11的CPU小核整体的二级缓存为1MB,而A12则为2MB。
需要指出的是,缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。
从上面的分析可以看到,苹果的缓存系统非常的强大,相比A11,A12系统缓存大小提升了一倍。而在实际运行当中,在CPU大核上有大约16MB的可用缓存层次结构,这远超于其他竞争对手。而缓存的增加,将大大节省了CPU直接读取内存的时间,将会使得CPU的处理速度更快,同时也能够在一定程度上降低能耗。
CPU性能媲美6代酷睿?
根据苹果官方公布的信息显示,A12基于台积电7nm工艺,内置六核心CPU,包括两颗性能核心和4颗效率核心。其中,性能核心相比上代性能提升了15%,功耗降低了40%;而效率核心则在功耗上降低了50%。
根据AnandTech的测试数据显示,A12的CPU采用2颗Vortex 2.5GHz大核和4颗1.59GHz Tempest小核组成六核CPU。
目前主流芯片的能耗比图示,深灰色为A12,浅灰色为A11,其他还有三星9810,骁龙845等等
根据SPECint2006基准测试数据显示,A12在上一代设备上的表现平均比A11好24%。单位能效比(即运算与耗电量对比)提高了12%,但是随着内部缓存的增加,功耗也增加了,A11的平均功耗约为3.36W, A12的平均功耗为3.64W。
AnandTech的基准测试表明,A12的内核和架构改进其实比“比苹果官方宣布的改进还深刻”,它在性能和功率上都超过了安卓阵营普遍采用的Exynos9810,骁龙845等芯片。
AnandTech表示,A12和前一代A11与桌面级产品CPU的差距之小“相当惊人”,他们还介绍了苹果如何通过软件调整来改善旧设备的性能。以iPhone 6s的A9为例,CPU的最高频率为435ms,但iOS 12的时间缩短至80ms,“大大提高了交互工作负载的性能”。A10也做了类似的改进(从400ms的提高到210ms),但A11没有什么变化。
总而言之,AnandTech表示,A12是苹果处理器的一个“大转变”,其CPU性能提升最高可达40%。在SPEC2006int测试中,A12的单线程性能甚至比降频的英特尔Skylake处理器还要优秀。
GPU性能达骁龙845两倍
去年年初,Imagination曾公开表示,苹果计划在15至24个月内不再在新产品中使用其知识产权。于是,在去年苹果A11推出之时,就有报道称A11的GPU是苹果自研的。但是实际上,其似乎仍然是基于Imagination的IP定制的。因为它的内核设计与之前Imagination的Rogue非常相似。另外,A12的GPU仍支持PVRTC(PowerVR纹理压缩),一种专有格式,意味着GPU仍有可能与Imagination的IP相关联。
而现在,时间已经过去了超过15个月,Imagination也已经被中资收购。所以A12将有望采用苹果自主研发的GPU。
图片来源:TechInsights Apple A12Die Shot,ChipRebel Apple A11Die Shot
不过,型号为G11P的A12 GPU(主频超过1.1GHz)仍然与去年的A11 GPU有一些非常明显的类似之处,其内部各个功能块似乎在很大程度上位于相同的位置并以类似的方式构造。
AnandTech表示,苹果在A12 GPU上取得的最大进步是它现在支持内存压缩,仅此一点就可以显着提升性能。在桌面领域,像Nvidia和AMD的GPU早已经支持这项技术很多年了,即使面对不增加内存带宽的情况下,它也能够提升GPU的性能。同样,智能手机的GPU也需要内存压缩,这不仅是因为移动SoC上的带宽有限,更重要的是因为与高带宽要求相关的功耗降低。
例如,Arm的AFBC(帧缓存压缩技术)技术一直是业内经常提及的一项技术,同样高通甚至Imagination等其他厂商也都有自己的相关技术。
所以,得益于支持内存压缩,7nm工艺的加持以及增加了一个GPU内核,A12的GPU性能也确实得到了大幅的提升。
根据苹果公布的数据显示,苹果A12内置了4核心的GPU,其性能相比上代(A11为3核心GPU)大幅提升了50%。
GPU测试
在GPU性能测试方面,AnandTech采用了GFXBench Aztec Ruins场景为测试基准(2K分辨),在高特效下,可以看到,A12 GPU的峰值性能比上一代的A11高出了61%,是高通骁龙845的GPU性能的两倍,更是秒杀基于麒麟970的华为P20系列。
小结:
从上的介绍,我们不难发现,相对于之前的A11来说,A12确实有了非常多的改进:不仅重新设计了系统缓存(被AnandTech称之为“自A7引入以来最大的变化”),对CPU核心也进行了显著改进,GPU开始支持内存压缩,同时还对NPU进行了重大升级改造,所有这些都带来了令人印象深刻的性能改进。