跳到主要内容

Qualcomm Hexagon NPU

厂商: Qualcomm

分类: NPU 神经网络处理器

架构: Hexagon (HTA + HVX)

简介

Qualcomm Hexagon NPU 集成在骁龙(Snapdragon)SoC 中,提供高效的 AI 推理加速。通过 Qualcomm AI Engine Direct 和 SNPE 框架使用,支持 INT8/INT16 量化推理。

规格参数

型号算力显存/内存接口TDP制程
Snapdragon 8 Elite45 TOPS (INT8)LPDDR5X (共享)集成 SoC10W3nm
Snapdragon X Elite45 TOPS (INT8)LPDDR5X (共享)集成 SoC23W4nm

官方网站

访问官方网站

驱动下载

Linux

相关文档

操作系统支持

WindowsLinuxmacOSAndroid
✅ (Snapdragon)✅ (Android)

版本历史

版本发布时间说明
QNN 2.x2024Snapdragon 8 Elite 支持

性能基准

型号任务性能指标
Snapdragon 8 EliteNPU TOPS45 TOPS (Hexagon)
Snapdragon X EliteNPU TOPS45 TOPS
Snapdragon 8 EliteStable Diffusion Mobile~10s/img

定价信息

型号参考价格备注
Snapdragon 8 Elite随 SoC 提供旗舰手机 SoC
Snapdragon X Elite随 SoC 提供Windows on ARM

快速安装

Android / Windows on Snapdragon

Hexagon NPU 通过 Qualcomm AI Engine Direct 调用。

# 安装 QNN SDK (从 Qualcomm Developer Network 下载)
# 支持 TFLite/ONNX 模型编译和部署

代码示例

Python (QNN Runtime)

# 使用 QNN SDK 运行编译后的模型
from qnn import QnnRuntime

runtime = QnnRuntime()
model = runtime.load("model.qnn")
output = model.run(input_data)

架构特色

  • Hexagon DSP + HVX: Qualcomm 标量/向量 DSP 架构,支持 AI 推理和信号处理
  • HTA (Hexagon Tensor Accelerator): 专用张量加速器,面向 Transformer 模型优化
  • AI Engine: 统一 AI 软件栈,覆盖 Hexagon + Adreno GPU + Kryo CPU

模型兼容性

模型/框架支持情况备注
QNN SDK✅ 原生最佳支持
TFLiteNNAPI/Hexagon 后端
ONNXQNN 编译
Stable Diffusion移动端优化版
Whisper端侧语音

相关产品

如果你在评估替代方案,以下产品可能也适合你的场景: