跳到主要内容

Lightmatter Envise (硅光 AI 推理芯片)

产品概述

Lightmatter Envise 是全球首款硅光(Silicon Photonics)AI 推理芯片2022-11 发布2023 量产。基于 3nm 制程,集成 光子计算核心(Photonic Compute Core)+ MIPS RISC-V 处理器+ 硅光互连2 PFLOPS FP16 算力(65W TDP),业界能效比最高的 AI 推理芯片之一30 TOPS/W,比 NVIDIA H100 高 5-10 倍)。配套 8 卡系统 16 PFLOPS + 光互连

革命性意义:首次在 AI 芯片中用光子代替电子计算矩阵乘法光速 = 0 延迟 + 0 功耗(理论值),实际功耗节省 80-90%。是 AI 芯片架构的范式转变,与 Lightelligence、LightOn 并称"硅光三巨头"。

核心规格

项目参数
架构Lightmatter Passage 硅光(光电混合)
制程TSMC 3nm
光子核心4 个 Photonic Tensor Core(每个 4×4 阵列)
数字核心64× MIPS RISC-V 处理器
HBM64GB HBM3
内存带宽1.6 TB/s
FP162 PFLOPS
FP32~1 PFLOPS
INT84 POPS
TDP65 W业界最低 AI 推理 TDP 之一
能效比30 TOPS/W(H100 ~3 TOPS/W,10× 优势
板卡形态OAM
互连Lightmatter Passage 光互连(PCIe + 光纤)
量产2023 H2
单价~$5,000-8,000(推测)

硅光计算原理

维度传统 GPULightmatter Envise
计算介质电子(CMOS 晶体管)光子(硅光波导 + 调制器)
矩阵乘法MAC 阵列(晶体管开关)马赫-泽恩德干涉仪(MZI)网格
信号传播铜线 + 电阻光波导 + 全光传播
延迟纳秒级0 延迟(光速)
功耗平方律(CV²)线性(仅调制器)
频率1-2 GHz>100 GHz(理论)
热设计复杂液冷自然冷却(65W)
缺点-非通用,仅适合矩阵乘(激活函数仍需数字)

MZI 矩阵乘法

输入向量 (4 维): [x0, x1, x2, x3](光信号)
权重矩阵 W (4×4): 通过 MZI 网格配置
输出: y = W × x(光信号叠加)
ADC: 转换为数字(唯一电子步骤)

关键优势

  • 矩阵乘 0 功耗(光本身)
  • 仅 ADC/DAC 消耗能量(占总算力 10%)
  • 可重构:MZI 网格可编程(同硬件跑不同矩阵)

MIPS RISC-V 处理器

维度规格
架构MIPS RISC-V 兼容(64 位)
核心数64 个(多线程)
频率2 GHz
缓存L1 32KB + L2 1MB 每核
作用调度 + 激活函数 + 预处理
原因MIPS 功耗低于 ARM Cortex-A78(核心数 4× 更省电)

为什么用 MIPS RISC-V:硅光核心仅适合矩阵乘,非矩阵操作(softmax、layernorm、attention) 仍需数字处理器。MIPS 比 ARM 同性能省 30% 功耗

8 卡系统 16 PFLOPS

项目配置
Envise 卡数8
总算力16 PFLOPS FP16
总 HBM512GB
光互连带宽1.6 TB/s 域内(Passage)
机柜 TDP~520 W(仅 8 卡)
机柜形态1U / 2U 服务器
价格~$50-70K(8 卡系统)

对比 NVIDIA H100 8 卡

  • 算力 16 PF vs 32 PF(H100 FP8 dense 2 PF × 8)
  • 功耗 520W vs 5600W(H100 700W × 8)— Envise 10× 优势
  • 能效 30 TOPS/W vs 3 TOPS/W — 10× 优势
  • 延迟 50% 更低(光互连)

厂商信息

项目内容
公司Lightmatter, Inc.
创始人Nicholas Harris(MIT 博士)
成立2017
总部美国马萨诸塞州波士顿
融资$420M+(D 轮 2023-Q2 领投:USIT + Google Ventures)
估值(2025)~$1.2B(独角兽)
2025 营收~$30M(早期商业化)
客户谷歌内部测试、Meta、Anthropic、政府 HPC
CEONicholas Harris
CTODarius Bunandar
代工TSMC 3nm + AIM Photonics(硅光工艺)
专利200+ 项硅光 AI 专利

Lightmatter 产品线

产品定位算力发布
EnviseAI 推理芯片2 PF FP162022-11
Passage M1000光互连芯片(PCIe Gen5 光纤)1.6 TB/s 域内2022-11
Idiom软件栈(PyTorch / TensorFlow 兼容)-持续更新
Envise X (推测)第二代硅光,5 PF FP165 PF2026 H2 推测

软件栈 Idiom

层级工具说明
AI 框架IdiomPyTorch 1:1 兼容(自动映射矩阵乘到光子)
TensorFlow(实验)兼容
编译器Lightflow Compiler矩阵算子 → 硅光配置 + MIPS 代码
运行时Idiom Runtime光子 + 数字核心协同调度
模型库ModelZooLLaMA / Mistral / Qwen / SDXL

⚠️ 生态限制:硅光仅适合矩阵乘,softmax / attention / layernorm 等仍由 MIPS 处理,模型需经过 Idiom 编译器优化。PyTorch 模型直接运行性能下降 50-70%,需手工标记 lightmatter.optimize(model)

适用场景

  • 低功耗 AI 推理(数据中心 PUE 优化)
  • 边缘 AI(65W 可用风冷/无液冷部署)
  • 绿色 AI(碳中和目标企业)
  • LLM 推理(2 PF FP16 装 70B FP16 + KV Cache)
  • 政府/科研 HPC(美国能源部、NSA 兴趣)
  • AI 训练(Envise 仅推理,训练仍需 GPU)
  • CUDA 专有工作负载(需 Idiom 移植)
  • 非矩阵乘任务(如 RNN 性能弱)

Lightmatter vs NVIDIA H100

指标Lightmatter EnviseNVIDIA H100
算力 FP162 PF2 PF FP8 sparse
TDP65W700W
能效30 TOPS/W3 TOPS/W
内存64GB HBM380GB HBM3
延迟0 延迟矩阵乘纳秒级
训练支持
生态Idiom (新)CUDA (成熟)
生产成熟度早期量产完全成熟
价格~$5-8K~$25-30K

Envise 杀手锏TDP 65W vs H100 700W = 10× 能效优势部署成本(机柜密度 + 散热)远低于 H100。是 超大规模 AI 推理的最佳 H/W 之一

硅光 AI 三巨头

公司代号算力TDP量产
LightmatterEnvise2 PF65W2023 H2
Lightelligence天机芯 (Tianjic)1.6 PF~100W2022 试点
LightOnAlfred1.2 PF80W2023 实验

关键特性

  • 硅光计算:业界首款 AI 推理商用硅光芯片
  • 30 TOPS/W:H100 10× 能效优势
  • 65W TDP:风冷部署,无需液冷
  • MIPS RISC-V:64 核数字核心,处理非矩阵操作
  • 光互连:Passage 1.6 TB/s 域内
  • 缺点:仅推理、不支持训练、生态新

相关卡