6000字长文介绍高通骁龙 835,想买新手机的不要错过

2017-01-05 10:34:00 来源: 互联网

china0513-624x468

版权声明:本文本文由半导体行业观察翻译,转载请联系小编,谢谢。

虽然高通早前就已经披露了Snapdragon 835的相关信息,但是具体的细节还是不够详细。在CES开幕之前,高通终于带来了新一代旗舰的全部信息。作为Snapdragon 820/821的“接班人”,Snapdragon 835的出现会否给增长缓慢的手机产业带来新的动力呢?且看我们分析一下。

首先我们看一下新旗舰带来的性能提升。

china0513-624x468

最左边是Snapdragon 820、中间是Snapdragon 835,右边是20美分硬币

据介绍,Snapdragon 835是全球首个使用三星10nm的“10LPE”FinFET工艺制造的商用SoC。共同并没有披露整个die的尺寸,但是据介绍,整个封装尺寸较上代芯片小了35%,而内部集成的晶体管高达30亿个。 而三星方面也表示,和第一代的14nm 14LPE工艺相比,其第三代FinFET的效率提升了30%,性能也相应地提升了27%,而功耗则降低了40%。

Snapdragon 835除了会给智能手机和平板带来全新的动力外,还会给IPC、VR和AR头戴式显示(据闻现在有好几个相关的设备正在开发中)带来全新的支持。另外,早前和微软联合宣布的,支持Win10的超便携蜂窝PC设备,也是Snapdragon 835的另一个支持重点。这些PC将会运行传统的X86 32bit APP和UWP,同样也会支持Win10业已支持的接口和eSIM蜂窝连接支持。

china0513-624x468

对比市场现状,高通现在所处的位置和一年前有了很大的改变。回想去年发布820的时候,由于在Snapdragon 808和810上的表现不佳,高通当时受尽了行业的批评。事实证明ARM Cortex-A57和TSMC的20nm工艺并不是一个很好的组合。导致了820的“前任”并不能满足客户的性能和温度的需求。但是在Snapdragon 820的优越表现,为高通赢回了客户的信心和消费者的印象。

而去年的Snapdragon 820的另一个重要意义就是高通首次推出了其自主设计的64bit CPU 核心kryo,这种自研的CPU(或者GPU/DSP/ISP)是SoC供应商打造差异化竞争的杀手锏。再加上Apple的64 bit CPU加入,手机SoC这个战场战况兴起。

从设计上看,Snapdragon 820几乎吊打其他所有SoC。在刚过去的2016年,几乎所有的安卓旗舰用的都是这颗芯片。

china0513-624x468

在推出了Snapdragon 835之后,高通寄望于继续发扬Snapdragon 820的优势,并希望借助这个新旗舰开拓一下未来:异构计算。这种方式是通过融合CPU、GPU和DSP等不同类型的处理器,以求迸发出新的能量。

高通希望利用这种新方式给设备带来新的功能和体验。例如给移动设备带来VR和机器学习。

从高通的介绍我们可以得知,Snapdragon 835拥有几项关键性能。正是这些特点吸引了我们对Snapdragon 835的深入讨论。高通在835内置的Hexagon 680 DSP上添加了单指令多数据(SIMD)的HVX(Hexagon Vector Extensions),这能够为前面提及的VR和机器学习加速,这同样给图片和计算机视觉任务带来了效率上的提升。

当然,Adreno 530 GPU的运算能力也得到了极大的提升。 高通同样介绍了为多核处理器提供电源管理的Symphony System Manager。

china0513-624x468

和其他竞争对手以及自己的前代旗舰相比,Snapdragon 835的革命性是无以伦比的。之前这系列SoC受到的限制,在Snapdragon 835上基本上都得到了解决。虽然我们已经就其性能和电池寿命上的提升做了解析,但考虑到手机SoC的复杂竞争背景,我们有必要对其一些细节进行深入介绍。首先从CPU入手。

CPU:

Snapdragon 835内嵌的Kryo 280 CPU是第一个使用ARM公司的新“Bulid on ARM Cortex Technology”授权设计的半定制架构,这个授权(缩写是BOC)是介于传统Cortex授权和架构授权之间。在过去的几代产品上,高通这三种授权方式都使用了。在Snapdragon 810上,用的是处理器授权;在Snapdragon 820上,用的是全定制的Kyro核,这是架构授权;而在Snapdragon 835上用的则是BOC这种新型授权方式。

BOC授权方式允许高通在ARM的core上做一些改变,更好的集成自身的IP(GPU、DSP等),进而制造出一个更符合自己性能和功耗目标的半定制core,满足高通预设的应用需求。但是微架构中也有一些东西是不能改变的。

china0513-624x468

在Kryo 280上,高通配置一个八核的核心,分别是拥有四个高性能大核和四个低性能小核的big.little架构。虽然高通并没有说采用了哪个ARM核,但我们明显可以看出,A53会是小核的最好选择,而高性能核心则可能是A72或者A73。同样地,高通也没有披露他们修改了什么。但高通明确了一点,那就是他们会在新的芯片里面使用一个定制化存储控制器。

我们也不确定高通是否在上面使用了CCI-550内部总线连接,还是说高通使用了自主的内部连接解决方案。因为大核有有一个很大的指令窗口,这就使得这些指令可以乱序执行,这就提高了芯片的潜力。

Kyro280小核的峰值频率是1.9Ghz,大核的峰值频率,保守估计也能达到2.45Ghz。根据ARM的介绍, 14nm的节点下,A73的工作频率能够轻易达到2.6Ghz和2.8Ghz之间。在三星的10nm工艺支持之下,这个数字应该会又提升一个数量级。基于现在Snapdragon 835的性能,我们就有了很多种猜测:

例如Kyro 280的大核用的是A72,而不是A73;高通做的改变则是指令窗口大小,然后限制了峰值频率;高通优化了峰值频率下的电池使用寿命;我预测新旗舰保留了很多动态余量,让Snapdragon 835的后续变体处理器可以获得大幅度的提升。

Snapdragon 835的L2 Caches较之Snapdragon 820提升了一倍。在小核上,使用的是1MB的L2 cache,但在大核上,则用到了2MB的L2 cache。这个大幅度增长的二级缓存能够降低功率损耗。

说到这,你一定奇怪为啥高通在Snapdragon 835使用的是半定制的内核而不是完全定制的Kryo架构。高通方面表示,这是基于现有的情况做的考虑,他们认为这是一种非常不错的选择。而其选择因素涵盖了性能、功耗、成本、可行性、市场影响力等等。

china0513-624x468

GPU

Snapdragon 835使用了一个升级版本的Adreno 540 GPU,它使用的架构和Snapdragon 820上所使用的Adreno 530是一样的。在新一代产品上,高通聚焦于提升ALU和寄存器组等方面的性能,虽然在产品发布上并没有提及。

相较于前一代,Adreno 540在拥有高阶的纹理滤波能力的同时,还降低了功耗。

根据高通,Adreno 540的3D 绘图性能相较于前代提升了25%。我们依然无法确定这当中有多少是来自于架构的提升。

Adreno指出最新的图形API,包括了OpenGL ES 3.2, DirectX 12和Vulkan.。值得一提的是他对OpenCL 2.0 和渲染脚本的完全支持。

DSP&ISP

china0513-624x468

Hexagon 680 DSP

在去年,高通在Snapdragon 820上推出了一个全新的Hexagon 680 DSP架构,而这个新的HVX针对图像和视频处理、虚拟现实和机器视觉等应用有了大的提升。

根据高通介绍,Qualcomm Hexagon 680 DSP(数字信号处理器),使用DSP卸载任务,可比 CPU更快完成且(/或)耗能更少。比如,用于Nexus 5手机的Hexagon DSP能使其MP3 播放续航时间翻倍。Hexagon 680 有两项主要的新特性:

第一,它是一个完全独立的、用于传感器处理的DSP。它被巧妙地命名为“低功率岛”( low power island),用于改善“始终开启”用例中的电池续航时间,包括计步器或活动计数器,以及传感器辅助定位(当GPS 信号不够强时,你手机的传感器可以提供更精确的定位)。

第二项特性是以Hexagon向量扩展(HVX)的形式为Hexagon DSP 提供更新水平的功率。这个增加的硬件在与Qualcomm Spectra相机图像信号处理器(ISP) 配合使用时,支持先进的成像及计算机视觉。例如,在弱光情况下,骁龙 820 将通过ISP 和 DSP 自适应地增亮视频和照片中较暗的区域,使其不会显得过暗。借助于Hexagon 680,骁龙 820 在执行该操作时是前几代骁龙处理器速度的3倍,且能耗仅为10%。

Hexagon 680 DSP内置了一个1024bit的SMID矢量数据寄存器,高通称之为Hexagon Vector Extensions—Hexagon矢量扩展,简写为HVX。HVX每次可以处理四条VLIW向量指令,每个循环可以处理多达4096bit数据,需要注意的是,一般实际应用中的指令比DSP支持的最大指令宽度要小很多,不过借助于SIMD和系统的特性,单个指令可以一次操作多个数据,因此在计算中很多数据可以被一次性填充进入处理过程,实现效能的最大化。

另外,HVX为了实现上下文切换功能,还设计了32个向量寄存器。规格方面,HVX支持32位的定点十进制数的操作,但不支持浮点计算,这应该是考虑到晶体管数量和功耗的原因,一般情况下也没有浮点计算的需求。总的来看,这样的规格和性能足以满足4K视频以及20M像素摄像头的处理需求了。高通还展示了HVX底层设计的一些细节。HVX内部拥有L1数据和指令缓存,4个并行的VLIW标量处理单元,单元的运行频率为500MHz,还有共享的L2缓存。此外,HVX中还有两组独立的矢量单元,这样设计实际上是为了执行多线程任务,比如同时处理音频和图像处理,矢量单元可以独立进行计算。

china0513-624x468

和CPU一样,Hexagon 680 DSP使用了一个多线程编程模式,这是专门针对处理器做的设计,目的是为了加速包括数据流在内的特定任务。这意味着这个DSP的存在是辅助CPU和GPU工作,而不是替代。例如,为了降低die的空间和功耗,它只执行整数运算,而不是浮点运算。这样的设置让这个DSP在处理某些任务时,比CPU更有性能和功耗的优势。

高通在介绍中也没谈及太多Snapdragon 835内用到的Hexagon 682的提升。但考虑到去年680的大变化和今年682在型号上的小变化,我猜测Hexagon 682架构和上面介绍的差不多。

和Snapdragon 820一样,Snapdragon 835同样有两个DSP核,一个在X16 LTE Modem中执行信号处理;另一个就是被高通称为All-Ways Aware Hub的超低功耗DSP核心。后者连接到很多的传感器,做相关的数据处理。值得一提的是,它能够支持Google的Awareness API,同时它还支持很多低功耗的跟踪,例如步数统计,利用LTE、WIFI和BLE去确定位置。当然,正如名字所言,这个DSP是常开的,这样就可以不间断的收集传感器的数据,并提供给APP,执行更多复杂的计算。

china0513-624x468

Snapdragon 835还封装了一个升级版的ISP。据介绍,这颗旗舰里面用到的Spectra 180,这是一个14bit的ISP,能够支持一个32MP的camera,或者支持2个16MP的camera。这对于现在旗舰机来说,是一个重要的提升。另外,这个ISP的自动对焦系统也获得了提升,它能够基于光线情况选择最好的AF,它同时还支持2PDAF技术,它能够把每个像素(通常是最大的1.4μm像素)分割成两个光电二极管,一个用于图像捕捉,一个用于相位检测。通过利用每个像素来执行相位检测,其AF性能获得了显著的提升,在低光线的情况下,对焦速度可以做到PDAF的两倍。

在高通的介绍里,着重介绍了Snapdragon 835的六大优势,其中包括了电池寿命、连接、安全、图片和视频、VR和AR以及机器学习。当中最出彩的要数异构计算。因为这在Snapdragon 835上,是一个震撼的介入。

电池寿命

对于移动设备来说,功耗和发热是两个永恒的话题。尤其是在前面提到的高负载应用,问题更加严重。而Snapdragon 835的功耗优化比Snapdragon 820有了明显的提升。可见,转到10nm工艺的提升是很显著的,当然,架构转到Kryo280 CPU的帮助也是不能忽视。高通在小核的功耗优化上花了很多的心思,因为按照高通所说,人们使用设备的时候,80%的时候用的是小核。

而在GPU等方面的优化,同样带来了功耗的降低。当然,Symphony System Manager升级也能带来更好的功耗优化。

china0513-624x468

高通表示,Snapdragon 835的功耗较之Snapdragon 820,减少了25%,和Snapdragon 801相比,功耗更是降低了50%。这还是在普通的负载情况下的测量。

这样的话,在一个搭配QHD显示屏、3000mAh电池和Snapdragon 835的手机上,能够持续播放4K视频三个多小时,而VR游戏时间也可以延续两个多小时。Snapdragon 835更是支持高通的Quick Charge 4.0,这个快充较之前一版本,速度提升了20%,效率也同时提高了30%。

连接

高通Snapdragon 835集成了一个X16 LTE Modem,利用3×20Mhz的载波聚合(CA)和256-QAM的模式,能够支持下载速度达1Gbps(cat 16)。这种高下行速度的获取是通过在两个CA上利用4×4 MIMO加上在另一个载波上使用2×2MIMO来产生10个独特的数据流实现的。而上行速度也支持150Mbps(cat 13),这是通过使用2×20Mhz的载波聚合和64-QAM实现的。

china0513-624x468

随着业界往5G的推进,高通本身对G级别的LTE有了很高的关注度。而为了实现更好的网络接收,高通认为使用Snapdragon 835的手机应该4个蜂窝天线(加上WIFI、蓝牙、NFC等,一个手机所带有的天线就高达7到10个)。由于手机的空间有限,OEM只能导入更小的天线来实现那么高的频率。这就使得在1.8GHz和2.6GHz这个频段之间,就需要4×4的MIMO,而在低的频段,2×2MIMO则可以实现了。现在运营商也开始推广支持G级别的LTE(高通方面表示,运营商会在2017年先后释出相关的网络支持)。

老实说,我对于OEM在手机中如何安放4条天线,是非常感兴趣的。就目前来看,就算运营商不支持4×4MIMO,但是对于手机来说,这种配置带来的优势是非常明显的,就像三星S7,带来的信号提升是非常显著的。

Snapdragon 835同样支持2×2 MU-MIMO的802.11ac WIFI,蓝牙5,与WCN3990芯片配对是,还支持FM。可以看到,835是首个支持蓝牙5的解决方案。据介绍,其带宽高达2Mbps,是蓝牙4.2的两倍。覆盖范围更是前代的四倍。而在WIFI功耗方面,835比820减少了60%.

另外,由于提供了LTE/LAA/WIFI天线共享,这就可以降低了手机的天线使用。据介绍这个降低数字可以高达三个。

再者,Snapdragon 835还支持802.11ad,这就让其WIFI速度可以高达4.6Gbps。由于这是一个分立的解决方案,所以还需要配合其他芯片才能实现。

china0513-624x468

图片和视频

现在由于智能手机的竞争非常激烈,OEM也在寻找差异化产品的设计方案。回到几年前,很多人选择的解决方式首先是软件,然后是更大、更高清晰度的屏幕,紧跟着的材料和设计,到了现在,则是camera了。

在2016年,我们看到,很多款手机旗舰都使用了双摄像头的方案,我认为在可见的未来,这种潮流将会继续持续。

前面我们已经提过,Snapdragon 835的Spectra 180 ISP支持双16MP摄像头,这让OEM可以使用两个不同的镜头。就像iPhone 7上使用的广角和56mm镜头、LG G5上用的广角和鱼眼镜头,能够使用本身的“Smooth Zoom”功能去切换。

OEM同样可以使用高通的Clear Sight算法去讲两个不同摄像头传感器的输出结合到一起。第一个传感器用一个RGB彩色滤波阵列获取颜色数据;然后利用第二个黑白传感器获取亮读数据。通过这种方式,可以获得更鲜艳,更高对比度和更低噪音的照片。

Snapdragon 835同样通过使用682 DSP,继续保持对Google Halide语言的支持,进而执行硬件加速的图像处理。谷歌在Snapdragon 820的时候通过使用Pixel的HDR+ camera模式,实现图像的增强。OEM同样可以使用这种方法,通过迅速锁定人脸来增强自动对焦能力。

china0513-624x468

因为很多图像功能实现都需要很强悍的硬件和软件开发。因此高通推广了他们的Snapdragon Camera Modules。这些预设方案,已经集成了调试好的软硬件,OEM可以直接使用。这就加快了他们上市的时间,还降低了其工程师的开发时间。现在有三种模式可选择:包括含有PDAF的单摄像头和上面讨论的双摄像头方案。

Snapdragon 835同样还包含了最新的视频捕捉和回放能力。Snapdragon 835的VPU和DPU现在能够加码4K视频(HDR10)。

china0513-624x468

虚拟现实

高通在Snapdragon 835持续推进对AR和VR的支持,能够被应用到HMD和智能手机的Daydream的支持。由于VR对高清晰度的3D视频、位置音频、空间追踪和手势识别都有更高的要求,且希望在一个SoC上实现,这对芯片来说,也是一个大的挑战。同样这个应用对板上处理器的性能和结合有很高的需求。据高通方面表示,Snapdragon 835的延迟低到15ms,较上一代的18ms有了提升。这就降低了眩晕的可能。

china0513-624x468

高通的Visual Inertial Odometry (VIO)系统在头部动作追踪的过程中,利用Hexagon 682 DSP 去处理从摄像头来的30fps视频流。而另一个All-Ways Aware DSP是用来处理频率为800HZ和1000HZ的加速器和陀螺仪产生的数据。高通表示,使用DSP执行这些功能的效率比CPU提升了四倍。

china0513-624x468

高通方面认为,机器视觉是AR/VR的另一个关键构成。例如眼部跟踪是不能忽视的。通过对其处理可能会提供一个新的交互方式。手势识别同时能够增加你和虚拟物品的交互,在这个过程中则不需要其他的物理控制器或者配件。从DSP来的机器视觉数据能够传送给GPU进行处理,提升虚拟世界的沉浸感。

机器学习

对于手机来说,机器学习是另一个杀手级应用。这能够为机器视觉和智能助手等助力。高通的NPE(神经处理引擎)SKD在执行神经网络学习时,可以从Snapdragon 835的异构计算上获益。

而对于Snapdragon 835来说,其新增的功能包括支持客户生成神经网络层、同时还支持谷歌的机器学习架构TensorFlow。高通表示,Hexagon 682是首个支持TensorFlow和Halide架构的移动DSP。

china0513-624x468

老实说,从介绍上看,高通Snapdragon 835带来的影响力和前景都是可期的。但是凭借一颗处理器,给智能手机带来新的变革,希望有多大?未来的智能手机又会发展到什么方向?对大家来说,也是一个问号。

这个高性能的旗舰芯片又会给硬件市场带来什么的新革新和应用呢?让我们拭目以待。

china0513-624x468 【关于转载】:转载仅限全文转载并完整保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“半导体行业观察icbank”微信公众号。谢谢合作!

china0513-624x468 【关于投稿】:欢迎半导体精英投稿,一经录用将署名刊登,红包重谢!来稿邮件请在标题标明“投稿”,并在稿件中注明姓名、电话、单位和职务。欢迎添加我的个人微信号MooreRen001或发邮件到 jyzhang@moore.renchina0513-624x468

责任编辑:mooreelite
半导体行业观察
摩尔芯闻

热门评论