来源:内容来自半导体行业观察(ID:icbank)编译自anandtech,谢谢。
在今年的夏威夷技术峰会上,高通再次揭开并详细介绍了该公司今年最重要的发布——最新的骁龙旗舰 SoC,这颗芯片将为我们即将在2022年推出的安卓设备提供动力。今天,作为活动中的几个公告中的第一个,高通公司宣布了新的骁龙 8 Gen 1,它是去年推出的骁龙 888 的直接后续产品。
紧随前代产品,骁龙新芯片在营销和产品命名方面发生了非常明显的变化,这主要是因为该公司正试图简化其产品命名和阵容。8 Gen 1 仍然是“8 系列”的一部分,代表着该系列的最高端产品,但公司使用新的命名方法,躯体了之前的三位数命名方式。对于高通的旗舰产品,这非常简单,但这对 7 和 6 系列意味着什么,还有待观察,因为这两个系列每一代都有多个部分。
在骁龙 8 Gen 1上,高通为其带来了很多新 IP:我们看到了来自 Arm 的新三核 Armv9 Cortex CPU 内核,全新的下一代 Adreno GPU,大规模改进的成像pipeline ,此外还具有很多新功能、升级的 Hexagon NPU/DSP、集成的 X65 5G 调制解调器,所有这些都在更新的三星 4nm 工艺节点上制造。
新芯片有望大幅提高许多处理元件的性能和效率,并带来新的用户体验。让我们从基本规格开始,深入了解芯片上的细节:
关于Snapdragon 8 Gen 1 (简写为 S8g1)的介绍,我们从其CPU 开始:这是高通第一款采用Armv9设计的CPU ,其中包括 Cortex-X2、Cortex- A710 和 Cortex-A510,三个核心分别位于处理器大、中和小设置中。在这颗CPU上,高通继续使用 1+3+4 的核心数设计,这种设置首次在Snapdragon 855上亮相,并且在过去几年中给设计人员带来相对成功的体验。新芯片的 Cortex-X2 内核时钟频率为 3.0GHz,比骁龙 888 上 X1 内核的 2.84GHz 时钟频率略高。这实际上让我有点惊讶,因为我对这一代处理器频率的增加并没有太高的期望,但很高兴看到 Arm 供应商现在经常实现这一目标。作为对比哦,联发科最近宣布的天玑 9000在其 X2 内核上实现了 3.05GHz评率,但这是在台积电 N4 节点上实现的。相比之下,高通在三星 4nm 节点上制造 Snapdragon 8 Gen 1。该公司并没确认这个工艺是4LPE 变体还是其他的定制,因此我们在规格表中将其保留为“4nm”节点描述。最令人惊讶的是,高通声称在X2 内核上,将性能提高了 20% 或将功耗降低了 30%,特别是后面这个的数字尤其耐人寻味。因为根据三星代工厂描述,他们从 5nm 到 4nm 节点的迭代,仅让功耗降低了 16%,而30% 的数据比工艺节点承诺的要好得多。我们向高通询问了什么样的改进会导致如此大的功率下降,但该公司并没具体说明任何细节。我还特别询问了高通,在新的 X2 内核上,公司是否提供了自己的电压域(voltage domain),因为在Snapdragon 旗舰之前的1+3 big+middle核心中,实现了共享的相同电压轨(voltage rail),但该公司甚至不会确认是否是这种情况。Arm 曾指出,在 与X1相同的峰值性能点上,X2 的功率可能相当低,如果高通的营销材料提到的数据是基于这样的比较,那么这些数字是说得通的。X2 内核配置了 1MB 的 L2 缓存,而三个 Cortex-X710 内核则各有 512KB的缓存。来到中核上,新处理器的主频略高,做到2.5GHz,比上一代略高 80MHz。根据我们的了解,中间内核应该更关注功耗预算,所以也许这种稍微增加的频率确实更准确地代表了工艺节点的改进。最后,新芯片还使用了四个 1.8GHz 的 Cortex-A510 内核。与几周前发布的天玑 9000 不同,高通在新处理器上利用了 Arm 的名为“合并核心”(“merged-core”)的新微架构方法,这意味着该芯片实际上有两个 Cortex-A510 复合体(complexes),每个复合体有两个内核,共享一个通用的 NEON/SIMD pipeline和 L2 缓存。合并核心方法旨在实现更好的面积效率。Qualcomm 将这种方法合理化,称在日常使用的线程较少且总体活动较少的情况下,让单个内核能够访问由两个内核共享的更大的 L2 缓存可以带来更好的性能和效率。但遗憾的是,该公司并没有详细说明这个新芯片的 L2 容量是多少。不过无论是 512KB 还是 256KB,这个配置也没有联发科天玑 9000 激进。Arm 的新 Armv9 CPU IP 还配备了新一代 DSU(DynamiQ 共享单元,集群 IP),高通也在新的 Snapdragon 旗舰上使用了它。Qualcomm 在这里选择了 6MB 的 L3 缓存大小,并指出这是由目标工作负载之间平衡系统性能的决定。至于系统缓存,高通提到芯片使用同样的4MB缓存,内存控制器依然是3200MHz LPDDR5(4x 16bit通道)。需要注意的是,与去年的骁龙 888 一样,CPU 不再可以访问系统缓存,以改善 DRAM 延迟。在折柳,我们不得不将其与联发科的天玑 9000 进行比较,因为后者可能具有更差的 DRAM 延迟,但也为 CPU 提供高达 14MB 的共享缓存,而骁龙 8 Gen 1 上仅为 6MB。至于这两款芯片在实际的商业设备中将如何比较,还有待观察。过去,高通公司的 Adreno GPU 架构在其家族和性能水平方面的表现很容易识别。特别是在架构方面,我们可以清楚看到,几年前 Adreno 600 系列开始于 Snapdragon 845 中的 Adreno 630。但与之前的 400 和 500 系列迭代不同,高通将这种表现方式一直保持到Snapdragon 888系列。到了Snapdragon 8 Gen 1 ,高通改变了一切。在新的 GPU 命名上,高通完全放弃了任何类型的命名方式,因此并不能透过命名去了解它否在在微架构方面做了重要转变,而这种转变在过去会作为新的 Adreno 系列对外营销。高通指出,从极高层次的角度来看,新 GPU 可能看起来与前几代相似,但其中包含大量旨在提高性能和效率的架构变化。Qualcomm 给出了并发处理优化等示例,旨在大幅提升实际工作负载的性能,而这些工作负载可能不会直接出现在基准测试中。另一个例子是 GPU 的“GMEM”在这一代看到了很大的变化,例如增加了 33% 的缓存(至 4MB),现在既是读写缓存,而不仅仅是用于 DRAM 流量优化的回写缓存。来到高阶性能方面,据高通介绍,新GPU的峰值性能提升了30%。在与骁龙888同等性能下,功耗则降低了25%。高通也一反常态地对峰值功耗数据和市场现状发表了评论。去年,Qualcomm 对 Snapdragon 888 的高峰值 GPU 功率数据进行了合理化,指出这是供应商针对其从其他玩家(尤其是 Apple)看到的情况而提出的要求,并且供应商将能够在他们的设备中实现更好的热封套(thermal envelopes)。但与在相机处理等瞬态计算工作负载中实际使用 GPU 峰值性能数据的 Apple 不同,目前 Android 生态系统并未对 GPU 计算进行任何高级使用。这种承认实际上是一种新鲜空气和对情况的洞察力,因为我在我们的麒麟 9000、Snapdragon 888 和 Exynos 2100 中特别注意到了这一点,并且Tensor对所有新芯片进行了深入的批评。这是一种非常愚蠢的情况,只要媒体继续强调峰值性能数据,就不会很快得到解决,因为芯片供应商将很难拒绝客户要求在其上运行芯片的请求。这边走。高通表示,公司尝试缓解这种对峰值性能关注的另一种方法是改变 GPU 性能和功率曲线的行为方式。该团队表示,他们已经开始改变架构以试图拉平曲线,不仅要实现那些可以说是毫无意义的峰值数字,而且实际上还专注于在 3-5W 功率范围内进行更大的改进,但在与 Snapdragon去年的 888 与骁龙 865 相比,这并没有显着提升。因此anandtech认为,新的骁龙 8 Gen 1可能仍然无法与苹果的 A14 或 A15 芯片竞争。而从提供的效率数据看来,甚至连联发科的天玑 9000 在同等性能水平下也应该比新的骁龙更高效,因此即使高通采用了三星最新的 4nm 工艺节点,但并能缩短与台积电竞争对手的差距。一段时间以来,我一直听说 2022 年的旗舰将进行大规模的摄像头升级,而从联发科和高通对下一代 SoC 的新功能描述,我们也看到了其背后的原因。Snapdragon 8 Gen 1 的新 ISP 使用了一个新的营销名称——“Snapdragon Sight”,其中包括对图像处理链中 IP 块功能的大幅改进。据高通介绍,新 ISP 现在能够实现每通道 18 位色深(color depth),高于上一代 的14 位 ISP。虽然现在的移动图像传感器在 ADC 方面仍然勉强是 12 位原生的,但引入了新的 HDR 技术,例如交错 HDR 捕获(staggered HDR capture),其中曝光在传感器的读数上紧随其后,这意味着基于这个处理器的新手机现在能够更快地捕捉图像,将它们重新组合成更高位深的结果。值得强调的睡,新的 18 位 ISP pipeline现在允许这些新传感器上叠加三个曝光的 HDR。增加的位深( bit-depth )应该允许在动态范围内增加 4 个档位(4 stops:或 2^4 = 16x 范围),这对于对比非常强烈的环境和具有非常挑战性的照明情况下的拍摄大有帮助。这远远超出了目前任何其他相机解决方案,并且能够以这种硬件方式实现这一点,该设计模糊了传统图像捕捉技术与过去几年更多由软件定义的计算摄影方法之间的界限。事实上,新的 ISP 架构似乎是将许多现有的计算摄影技术实现到固定功能块中的一种方式:有一个新的神经网络控制的 3AA(自动曝光、自动对焦、自动白平衡)和人脸检测块,这听起来与谷歌的 HDRnet 实现方式非常相似。据介绍,新ISP能让手机相机的夜间模式通过新的多帧降噪和图像堆得到了极大改进,现在能够堆叠和对齐多达 30 张图像,并在这一代实现更精细的细节。高通公司声称。新ISP带来的夜间模式拍摄效果提升是上一代产品的5倍。进一步的改进包括一个新的失真校正块( correction block),它现在也能够校正色差(chromatic aberrations),以及一个硬件视频散景引擎(hardware video Bokeh engine),能够在高达 4K 的视频录制中运行。可以将其视为与新款 A15 iPhone 上的新电影模式相同,但不仅限于 1080p。高通指出,ISP 上的所有 AI/ML/神经网络功能实际上都是在 ISP 本身上运行和加速的,这意味着它不会卸载到 Hexagon 专用的 ML 处理块或 GPU。就像注释一样 - 与 Dimensity 9000 的 9Gpixel/s 相比,Qualcomm 的 3.2Gigapixel/s 吞吐量指标似乎较低,这可能是两家公司宣传的指标非常不同,联发科宣传来自图像的低位深度像素的吞吐量每帧传感器数量,而高通则引用了 ISP 本身内的全位深度像素处理。在视频编码器和解码器方面,新芯片现在支持 8K HDR 录制,但其他方面似乎与骁龙 888 媒体块相当。这也意味着在今年的新旗舰上还没有支持 AV1 解码。高通不是开放媒体联盟联盟的成员,而是支持 VVC/H.266 和 EVC,但是随着谷歌和 YouTube 积极推动 AV1,而Netflix 等厂商也正在大规模采用该标准,高通在2022年还不支持这个格式,这将变成一个问题。去年的 Hexagon IP 模块对骁龙 888 来说是一个非常大的变化。当时,高通公司从相对独立的 DSP/AI 架构转向了一个更加融合在一起的模块,能够对标量、向量和张量运算进行同时操作。今年的迭代则是在之前变化上的改进。Qualcomm 指出,他们将块的共享内存增加了一倍,从而为更大的 ML 模型(增长速度非常快)提供了更高的性能。高通这次没有分享任何 TOPS 数据,而是表示我们新加速器的张量吞吐量性能提高了 2 倍,而标量和矢量处理的增幅较小。与骁龙 888 相比,通过硬件和软件改进的结合,他们确实将其性能大幅提高,但在同等软件基础上比较两个平台时,这个数字要小一些。据说这一代 AI 工作负载的能效提高了 70%,这实际上更重要,并且应该有助于更苛刻的持续 ML 工作负载。在连接性方面,骁龙 8 Gen 1 非常简单,因为它集成了高通今年早些时候宣布的X65 调制解调器。据之前的介绍,高通旗舰级骁龙 X65 5G 调制解调器及射频系统的关键创新包括:可升级架构,支持跨 5G 各细分市场进行增强、扩展和定制;并通过软件更新,支持即将推出的全新特性、功能,以及 3GPP Release 16 新特性的快速部署。特别是随着 5G 扩展至计算、工业物联网和固定无线接入等全新垂直行业,该可升级架构可以支持基于骁龙 X65 打造面向未来的解决方案,以支持全新特性的采用,延长终端使用周期,并有助于降低总拥有成本。第 4 代高通 QTM545 毫米波天线模组,旨在扩大移动毫米波的网络覆盖,提升能效。高通 QTM545 毫米波天线模组搭配全新骁龙 X65 调制解调器及射频系统,支持比前代产品更高的发射功率,支持包括 n259(41GHz)新频段在内的全球所有毫米波频段,同时保持与前代产品一样紧凑的占板面积。全球首创 AI 天线调谐技术,是将公司超过十年的开创性 AI 研发成果引入移动射频系统的第一步,为蜂窝技术性能和能效带来重大提升。例如,与前代技术相比,通过 AI 实现对手部握持终端侦测准确率 30% 的提升。这一提升可以带来增强的天线调谐功能,从而提高数据传输速度,改善覆盖范围,延长电池续航下一代功率追踪解决方案更小巧、更高效并且具备更高性能——与普通功率追踪技术相比,具备卓越性能和成本效益。最全面的频谱聚合,覆盖包括毫米波和 Sub-6GHz 频段的全部主要 5G 频段及其组合,FDD 和 TDD,通过使用碎片化的 5G 频谱资产,为运营商带来极致灵活性。高通 5G PowerSave 2.0,基于 3GPP Release 16 定义的全新节电技术,比如联网状态唤醒信号(Connected-Mode Wake-Up Signal)。高通 Smart Transmit 2.0,是由高通技术公司许可的独特系统级技术,可与骁龙 X65 调制解调器及射频系统搭配使用,通过利用从调制解调器到天线的系统感知功能,在持续满足射频发射要求的同时,为毫米波和 Sub-6GHz 频段带来更高的上传速率和更广的网络覆盖。骁龙 X65 调制解调器及射频系统的上述创新以及其它诸多性能提升,旨在通过更快的蜂窝通信速度、更广的网络覆盖以及全天电池续航,提供卓越的 5G 体验。骁龙 X65 将支持新一代顶级智能手机,并支持 5G 扩展至 PC、移动热点、工业物联网、固定无线接入和 5G 企业专网等细分领域。据介绍,这是兼容 3GPP 第 16 版的调制解调器,包括上行链路载波聚合等新功能。其他改进包括 3 个 100MHz 载波上的 300MHz Sub-6 带宽,以及毫米波带宽从 800MHz 增加到 1000MHz,允许新的峰值理论下行速度达到 10Gbps。Anandtech总结道,Qualcomm Snapdragon 8 Gen 1 是一个有趣的产品,因为它代表了该系列的一个全新的开始,无论是从营销意义上还是在技术层面上。作为骁龙 888 的后继者,新芯片将 CPU 设置彻底改造为新的 Armv9 架构,同时还带来了非常大的 GPU 改进、大量新的相机功能以及许多其他新功能。不过Anandtech指出,他们不喜欢高通的一点就睡他们从苹果的公关策略中吸取了教训,减少了披露的技术细节数量,甚至丢弃了 GPU、NPU/DSP 或 ISP 方面的 IP 块代编号等内容。这种不透明适用于生活方式产品公司,但不是一个很好的营销策略,也不是一家以其开发的技术而自豪的技术公司应该使用的。无论 Qualcomm 的营销方面和如何转变,对我们大多数读者而言,更关注的是他们的技术。从技术上来说,骁龙8 Gen 1在很多方面都是更大的升级。虽然高通并不像我们从最近的竞争对手公告中看到的那样激进,但该芯片在 CPU 配置方面表现非常出色,具有高达 3GHz 的新 Cortex-X2 内核、频率为2.5GHz 的Cortex-A710 中间内核以及新的 A510 小内核。性能指标,至少在 X2 的部分,看起来非常可靠,虽然电源效率仍然是我们在接下来的几周内必须更详细地调查的问题,但似乎也比预期更好。在我看来,新的 Adreno GPU 确实没有得到应有的关注,因为事情比演示文稿所展示的要复杂得多。虽然我们仍然不认为高通能够赶上苹果或像即将推出的联发科那样高效,因为人们对三星 4nm 工艺节点是否能够缩小与台积电竞争的差距的担忧仍然挥之不去,新架构变化是显着的,与骁龙 888 相比,我们应该会看到性能和效率的重大改进。最后,这一代最大的变化出现在相机和 ISP 系统部分。过去几年,智能手机相机在功能和图像质量方面取得了巨大进步,而不是放缓(与 SoC 的其他方面相比),技术进步似乎仍在全速前进甚至加速。Snapdragon 8 Gen 1 ISP 现在为我们在过去几年中看到的许多典型的“计算摄影”技术提供了固定的功能块,我认为这将在 2022 年为更多供应商实现更大的相机实现旗舰设备。因此,虽然 SoC 的其余部分可以被视为性能或效率的小幅度提升,但新的相机功能有望真正带来新的创新和体验。总体而言,骁龙 8 Gen 1 看起来是骁龙 888 的一个非常可靠的继任者。这对高通来说最重要:执行开发和交付绝大多数供应商可以依赖以实现到他们的设备中的芯片。虽然竞争正在多样化并加强他们的游戏部分性能,但目前来看,我们很难在市场上找到能与高通匹敌执行力的企业。最后,值得一提的是,在骁龙峰会现场,小米CEO雷军宣布,小米12将成为全球首发基于该处理器的智能手机。