高通史诗级骁龙上线，安蒙说时代变了，AI First的未来，是所有App都是“王牌应用”

2024-10-25 02:18| 发布者: 156| 查看: 414| 评论: 0

摘要: 　　从“无线通信公司”转型为面向新一代AI处理时代的“连接计算公司”，在过去很长一段时间以来，都是高通标榜自身的主基调，而今年在夏威夷茂宜岛如期举行的骁龙峰会，话题正是从这一基调展开。　　连接与计算，是 ...

　　从“无线通信公司”转型为面向新一代AI处理时代的“连接计算公司”，在过去很长一段时间以来，都是高通标榜自身的主基调，而今年在夏威夷茂宜岛如期举行的骁龙峰会，话题正是从这一基调展开。

　　连接与计算，是通信技术与智能技术的代称，新一代AI技术席卷之下，一切用户体验和商业逻辑都在被重构，就少不了连接与计算的力量，而手握这两种技术，高通自然使命必达。

　　在峰会开场时，高通公司总裁兼CEO安蒙花了大量篇幅，阐述了对下一代AI和人机交互方式变革的理解。

　　当AI出现时，人们问的最多的问题莫过于，AI的Killer App(王牌应用)是什么?安蒙随后说道，AI不存在Killer App的思维定式问题，因为AI变革的是人与计算机的交互方式，让计算机可以理解人的所见所闻、所思所想，所以，未来会出现成千上万的应用，而所有的应用都可以是王牌应用。

　　安蒙提及了一个银行App的例子。每个人手机中的银行App，都有同样繁琐的页面，但是未来在AI的帮助下，用户与银行App的交互完全可以用自然语言来完成，比如“帮我把这个单买了吧。”“我的本期账单是多少?”“什么储蓄计划适合我?”用户只需要用语言表达，AI就会自动完成操作。甚至用户在网上购物，只需要问购物App，“我想用我的借记卡购买，我的钱够吗?”购物App会自动关联到银行App，评估你的财力情况，在自动付款的同时也避免冲动消费。

　　这背后的一切，是“AI优先(AI First)”的体验，高通用一张图，具像化了这种AI变革体验。

　　首先AI要理解人的输入/输出(I/O)，包括语言、触摸、空间环境等，所有这些都会进入AI Agent(智能体);然后Agent理解用户的个性化数据，包括工作、娱乐、健康各种，再通过一系列多模态模型，最终所有的体验都是个性化且人性化的体验。这种体验，就打破了传统App的孤岛，App之间将会自由联动。

　　这将是一个巨变，会改变所有架构，包括操作系统、应用商店、算力平台等。用户可以有很多选择，选择更喜欢的Agent，选择更适合你的工作生产力、娱乐方式，数字生活。

　　为了让大家更易理解这种巨变，此处引用高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)在会后与科技行者的采访所说：

　　自智能手机问世以来，人机交互一直依赖双手，而有了利用规划器、智能体化AI处理，App在某种程度上被隐藏了起来，用户不再需要在手机中频繁切换不同的应用。“虽然高通并不设计终端，但随着这样的全新技术出现，未来可能会有新的终端产品形态，或者智能手机是否还会继续存在还是个未知数。随着用户交互方式的变革，这应该是很多终端设备厂商，尤其是手机厂商亟待思考的问题。”

　　在骁龙峰会2024期间，科技行者采访高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)

　　“我们看到了未来，未来即将实现，骁龙一定会帮大家把最好的技术落地，把明天的体验带到今天，把不可能变为可能。”安蒙强调。

　　而回应这句话最好的诠释，就是首先要有一颗“AI优先”的芯。

　　自研芯片架构，未来都是“至尊版”

　　高通技术公司手机、计算和XR事业群总经理阿力克斯·卡图赞(Alex Katouzian)登台，以一句话控场，也为他接下来的发布定调——“我们不满足于渐进式提升(所谓的挤牙膏)，高通希望打造一款全新的产品。”

高通技术公司手机、计算和XR事业群总经理阿力克斯·卡图赞(Alex Katouzian)

　　去年骁龙峰会上，高通就剧透了骁龙X Elite，而在今年，高通正式发布新一代移动平台：“Snapdragon 8 Elite”，中文命名“骁龙8至尊版”。

　　这次的命名没有延续传统，而是来个画风转变，是因为它与骁龙X Elite(骁龙的PC处理器)一样，也用了高通自研的Oryon CPU架构，区别是，这次进化到了第二代Oryon。按照高通的命名规则，Elite就代表了旗下性能最强的旗舰产品。这些年来，高通一直在加大自研技术投资，Oryon CPU就是在这一背景下诞生，它由高通收购的初创团队Nuvia开发，该团队领导者正是前任苹果首席芯片架构师Gerard Williams。

　　Oryon CPU是骁龙8至尊版的“王炸”，相当于是是给移动端处理器奉上桌面级CPU。高通技术公司高级副总裁兼手机业务总经理Christoper Patrick在随后的介绍中直指，“Oryon完成了高通整个SoC的最后一块拼图。”

　　性能方面总结而言，骁龙8至尊版采用台积电第二代3nm工艺，搭载了第二代高通Oryon CPU、高通Adreno GPU、增强的高通Hexagon NPU，三者各司其职。而提到这三者的互相作用，高通技术公司产品管理高级总监Siddhika Nevrekar打了个形象比喻：

　　假设高通AI引擎是一个交响乐团，Oryon CPU就是一位出色的指挥家，指挥每个音符、每个节奏、每个乐器创作出完美的AI交响乐;而Hexagon NPU就是那位出色的小提琴手，它将在AI最激烈的演奏中，成为舞台焦点。

　　接下来我们一一道来。

　　1、 Oryon CPU：满足特殊计算需求

　　大家知道，CPU对于管理系统层面的处理相当重要，它能执行来自应用程序、操作系统和用户输入的指令，也能运行高端游戏、视频剪辑软件、AR、AI、安全等复杂应用。

　　第二代高通Oryon CPU有两个重要创新，其一是面向移动端设计的全新微架构，其二是大幅改进的内存架构。

　　首先在微架构方面，骁龙8至尊版搭载了2个超级内核(Prime)+6个性能内核(Performance Core)，「超级内核」的最高主频达4.32GHz，以应对需要更快响应速度的密集型应用;「性能内核」的最高主频达3.53GHz，每个性能内核都经过调优，负责运行最密集型的应用程序，同时具有极高能效。

　　这里值得注意，骁龙的几代更新已经逐渐减少了效率内核，直到今天被性能内核完全取代。因为后者能提供最佳的性能和功耗组合，更适合这个AI时代的实际用例，所以效率内核就退出历史舞台了。

　　为了进一步证明Oryon CPU的强劲性能，高通也亮出了一系列基准测试。对比第三代骁龙8，骁龙8至尊版商用机在单线程和多线程基准测试中，单核性能提升45%、多核性能提升45%、能效提升44%。

　　阿力克斯·卡图赞在现场打趣说，“所有这些基准测试，都是基于高通的参考设计在实际室温环境下完成，不同于其他厂商在冷冻环境中运行以获得更高性能。”

　　此外还有Speedometer基准测试。这里有必要提一下Speedometer，它是用于衡量网页浏览等日常用例用户体验的测试工具，网页浏览看似平淡无奇，但它却是大家使用最频繁的应用，它会影响页面加载、快速转换、流畅滚动和后台计算等体验，还影响搜索、购物、研究和学习等日常体验，以及微信等应用内集成的体验。在该测试中，Oryon CPU浏览器上网性能提升62%(据说这是一个跨代际的提升)、能效提升45%。

　　高通Oryon CPU大放异彩的另一个领域是大幅改进的「内存架构」，通过采用最大的缓存来增强每一个CPU丛集——每个丛集都拥有12MB的二级缓存，总计24MB紧密耦合的专用缓存。

　　此外，考虑到生成式AI高度依赖内存，骁龙8至尊版配备了目前最高速的LPDDR5内存，实际频率5333MHz，等效于10.7GHz。以上，第二代Oryon CPU在微架构和内存方面的升级，让骁龙8至尊版可以带来更快的应用启动、多任务处理很丝滑、以及先进的生成式AI功能。从中受益最大的用例之一——游戏。骁龙8至尊版基于Oryon CPU带来的能效提升，可以将游戏时长延长2.5小时，同时不妥协流畅的游戏体验。实际用例上，针对虚幻引擎的Chaos Physics系统，Oryon CPU可以直接在终端侧实时模拟物理系统，且能在5毫秒时延内，处理超过1000个物体破坏和碰撞的情景。

　　2、 Adreno GPU：带来高保真图形

　　当然，CPU并不是骁龙8至尊版唯一重新设计的组件，Adreno GPU也是完全重新设计。高通技术公司产品市场经理Matt Grossman介绍说，“Adreno GPU在开发时，就充分考虑到手游玩家的需求，针对现代图形工作负载进行调优，能够提供基于着色处理器的独立内核，从而实现更佳工作分配和并发性能。”对于图形密集型游戏，其性能将提升40%，功耗降低40%，骁龙8至尊版的光追性能提高了35%。

　　除了性能提升之外，高通还在强强联合，带来绝佳游戏体验。现场，骁龙游戏工作室与Feral Interactive合作，将于12月推出《超级房车赛：传奇(Grid Legends)》移动版，它在骁龙8至尊版上，能够以2倍帧率运行，且将独家支持高通自适应性能引擎4.0。在不断追求“重新定义移动游戏”的过程中，高通与网易伏羲实验室合作，在《永劫无间》手游中，玩家可以用语音与AI队友互动，这些AI队友化身“神队友”，向新玩家提供策略来玩游戏。而且，双方还实现了首个游戏内终端侧大模型，这意味着，AI队友可以针对独特问题，进行定制化对话或给出建议。

　　更进一步，高通还在瞄准下一代游戏体验。虚幻引擎5的Nanite解决方案将首次在移动端运行，且仅在骁龙平台上运行，目前骁龙8至尊版可以支持在移动游戏中渲染电影级质量的3D环境。

　　3、 Hexagon NPU：带来更智能的交互为了把端侧AI践行到底，高通一直在磨练高通AI引擎，而它的核心，正是Hexagon NPU。Hexagon NPU这次也有重大改进：首先，所有内核的吞吐量都更强了，以实现更快的AI推理性能;其次，标量和向量的内核都增加了，向量加速器有6个核心，标量加速器则有8个核心，以满足生成式AI运算需求，支持更长上下文。与第三代骁龙8相比，全新架构的Hexagon NPU性能提升45%，能效提升45%。结合提升的CPU和GPU，骁龙8至尊版能够跨所有核心动态管理AI负载。

　　有了高通AI引擎，骁龙8至尊版可以在终端侧离线运行个性化、多模态、且安全的AI助手，这位AI助手也是全能助手，因为它的底层有多个模型在支撑，包括自动语音识别(ASR)、大语言模型(LLM)、大视觉模型(LVM)、多模态大模型(LMM)——这些模型，就像训练有素的团队一样运作，这就是异构计算的魔力。

　　或许在以前，当人与AI助手聊天时，AI响应的第一步，是先把语音转文本，再让语言模型通过文本看懂;而现在有了多模态模型，就能省掉这一步。

　　不要看这一小步，背后是效率提升的一大步。它带给用户最直观的感受，就是语音交互极速响应，几乎感觉不到延迟，就像和真人说话一样，AI助手能够立刻“听懂”人类语言。

　　为了让大家更易理解AI智能体，高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)在会后采访中举例说道，比如我拿起手机说：“今晚帮我订一个墨西哥菜餐厅，距离不要太远，评分要高，到店时间预计晚上7点30到8点30之间，而且得是我过去三个月没有去过的餐厅。”

　　要回答这个问题，智能体会调用各种模型来处理，包括位置信息、个人知识图谱等，而个人知识图谱，是存储在终端侧的用户情境信息(例如喜欢的饮食、锻炼习惯、常用联系人和消息、过往偏好历史)，从而帮助手机理解用户意图。

　　“每个厂商都有不同的方向来打造智能体。”马德嘉说道，高通有非常广泛的AI合作伙伴，包括Meta、IBM、Mistral、OpenAI、谷歌、智谱、腾讯、百川等。“我相信未来会出现定制的专用智能体，而高通旨在为构建高效的智能体体验，提供所需的底层软件技术支持。”

　　在生成式AI的表现方面，Hexagon NPU在基础大语言模型上的token生成速率提升了100%;在快速响应方面，在一些主流的大语言模型上，骁龙8至尊版的处理速度超过70 tokens/秒。除了文字和语音交互，AI助手首次可以完全在终端侧，通过摄像头“看到”用户所看到的内容，如此一来，用户可以通过相机或传感器，与AI助手实时互动。