跳到主要内容

Etched Sohu ASIC

厂商: Etched

架构: Transformer ASIC

分类: ASIC 专用加速卡

简介

专为Transformer架构硬编码的ASIC芯片。去除了GPU中用于图形渲染和通用计算的冗余逻辑,号称在Llama等大模型上比NVIDIA H100快数个数量级。

规格参数

型号算力显存/内存接口TDP制程
SohuTransformer 专用 (数倍 H100)外部 HBMPCIe 5.0待公布待公布

官方网站

访问官方网站

操作系统支持

WindowsLinuxmacOSAndroid
✅ (Etched Cloud API)

版本历史

版本发布时间说明
Sohu 预发布2025宣称 Llama 推理速度远超 H100

性能基准

型号任务性能指标
SohuLlama 2 70B 推理超高吞吐 (官方数据)
SohuTransformer 推理专用 Transformer 推理加速

定价信息

型号参考价格备注
Sohu云端 APIEtched Cloud API
Sohu需询价企业部署

快速安装

Etched Cloud (API)

pip install etched-sdk

Sohu 是专用 Transformer ASIC,仅支持 Transformer 架构模型推理。

代码示例

Python (Etched API)

from etched import EtchedClient

client = EtchedClient(api_key="your-key")
response = client.generate(
model="llama-3-70b",
prompt="你好",
max_tokens=100
)

架构特色

  • Transformer ASIC: 世界首款专为 Transformer 架构设计的 ASIC,硬件直接实现注意力机制
  • 极致推理: 跳过通用计算的灵活性开销,将 Transformer 推理效率推到极致
  • 限制: 仅支持 Transformer 架构模型,不支持 CNN/图神经网络等

模型兼容性

模型/框架支持情况备注
Transformer LLM✅ 原生Llama/GPT/Qwen 等
CNN 模型不支持
非 Transformer仅 Transformer 架构

相关产品

如果你在评估替代方案,以下产品可能也适合你的场景: