Skip to main content

年终对比文章 - 数据收集进度追踪

创建时间:2026-06-28 最后更新:2026-06-28 目标:为"国产AI芯片vs国际AI芯片2026年终对比"文章收集完整数据


📊 已收集数据汇总

1. 昇腾910C(华为)

数据来源:Lennart Heim分析(知乎转载)

指标数值置信度备注
FP16~800 TFLOPSHeim预估,官方未公布
内存带宽~3.2 TB/sHeim预估
性能对标~80% of H100Heim评估
架构双910B堆叠confirmed
逻辑面积比H100大60%Heim分析
FP32~320 TFLOPS(推算)根据架构推算,未证实

待补充

  • FP32官方数据(或可靠第三方测试)
  • INT8算力
  • FP8支持情况
  • 实际训练性能测试数据

2. B200/GB200(NVIDIA)

数据来源:知乎技术解读、EET China

指标数值置信度备注
晶体管数2080亿官方数据
FP162,250 TFLOPSEET China报道
FP418 PFLOPS(峰值)官方数据
显存192 GB HBM3e官方数据
显存带宽8 TB/s官方数据
TDP1000W(单GPU)HGX B200配置
GB200 TDP2700W(2 GPU+1 CPU)官方数据
NV-HBI10 TB/s双die互联带宽

待补充

  • FP32实际性能测试
  • 实际部署案例和性能benchmark
  • 价格信息

3. 邃思2.0 / 云燧T21(燧原科技)

数据来源:百度百科、燧原官方

指标数值置信度备注
FP3240 TFLOPS官方数据
TF32160 TFLOPS官方数据
INT8256 TOPS官方数据
显存64 GB HBM2E官方数据
显存带宽1.8 TB/s官方数据
TDP~300W(推测)OAM模组
架构GCU-CARA燧原自研
制程12nm(格罗方德)官方数据
互联GCU-LARE,300GB/s官方数据

产品定位:云端训练

待补充

  • T21具体TDP
  • 实际训练性能测试
  • 下一代产品(邃思3.0)规格

4. 昆仑芯R200(百度)

数据来源:知乎技术规格解析

指标数值置信度备注
FP3232 TFLOPS官方数据
FP16128 TFLOPS官方数据
INT8256 TOPS官方数据
显存16/32 GB GDDR6官方数据
显存带宽512 GB/s官方数据
TDP150W官方数据
架构XPU-R百度自研
接口PCIe Gen4 x16官方数据

产品定位:推理为主,兼顾训练

待补充

  • R300(新一代)规格
  • 实际性能测试数据

5. 天垓150(BI-V150)(天数智芯)

数据来源:什么值得买开箱评测(2026-01-08)

指标数值置信度备注
FP3248 TFLOPS开箱评测数据
FP16~192 TFLOPS(推算)根据FP32×4推算
显存64 GB HBM2e官方数据
显存带宽~2 TB/s(推算)根据HBM2e推算
TDP350W官方数据
制程7nm官方数据
架构ivcore11天数智芯自研
接口PCIe 4.0 x16官方数据

产品定位:通用计算GPU(训练+推理)

待补充

  • FP16官方数据(当前为推算值)
  • INT8官方数据
  • 显存带宽官方数据
  • 实际性能测试数据

更新日志(2026-06-28)

  • ✅ 新增FP32 = 48 TFLOPS(来源:什么值得买开箱评测)
  • ⚠️ FP16为推算值,需官方确认

6. 瀚博SV100系列(瀚博半导体)

数据来源:知乎文章(2022年发布)

指标数值置信度备注
INT8>200 TOPS官方数据(2022年)
支持精度FP16、BF16、INT8官方数据
TDP75W(VA1加速卡)官方数据
显存32 GBVA1加速卡
视频解码64路+ 1080p官方数据
架构通用DSA瀚博自研

产品定位:云端AI推理

待补充

  • SG100(GPU)规格
  • 最新产品规格(2026年)
  • 实际性能测试数据

7. 2026年Q1市场数据

数据来源:松果市场洞察(百度百家号)

指标数值同比变化
国产AI芯片市场份额52.3%+32.3%(从20%→52.3%)
NVIDIA市场份额42.7%-52.3%(从95%→42.7%)
里程碑首次突破50%历史第一次

关键洞察

  • ✅ 政策驱动型采购占主导(政务、金融、能源等战略领域国产化率>70%)
  • ✅ 生态迁移开始:DeepSeek V4完成从CUDA到CANN的迁移
  • ⚠️ 2027-2028年政策红利退潮后,市场化竞争才是真正考验

待补充

  • 2026年Q2数据(7月可获取)
  • 各厂商具体出货量数据
  • 按应用场景拆分的市场份额(训练vs推理)

8. 清微智能(可重构AI芯片RPU)

数据来源:搜狐新闻(2025-07-27)

指标数值置信度备注
架构可重构(RPU)清华技术转化
产品TX81(云端)2025年量产
订单~20,000张报道数据
出货量>2000万颗(累计,含端侧)报道数据
技术特点动态重构,适应不同任务官方宣传

产品定位:差异化路线(非GPU架构)

待补充

  • TX81详细算力数据
  • 云端产品规格
  • 实际性能测试数据

🔍 待收集数据清单

高优先级(本周内完成)

国产芯片

  • 天垓150(BI-V150):FP32/FP16/INT8算力、显存带宽 ← 急需
  • 燧原云燧T21:完整TDP功耗
  • 昆仑芯R300:完整规格
  • 瀚博SG100:完整规格(GPU产品)
  • 清微智能TX81:详细算力数据

国际芯片

  • MI300X/MI325X:实际性能测试数据、价格
  • TPU v6(Trillium):规格数据
  • L40S/L4:推理性能数据

市场数据

  • 2026年H1出货量数据(IDC、赛迪)
  • 各厂商营收数据(华为、寒武纪、燧原等)
  • 主要客户采购公告(字节、阿里、百度等)

中优先级(7月内完成)

  • 各芯片软件栈最新版本和特性
  • 实际模型迁移案例和时间
  • 开发者社区活跃度数据

低优先级(8-9月完成)

  • 各芯片能效比详细测试
  • 实际部署案例分析
  • 用户满意度和反馈

📅 数据收集时间表

Week 1-2(2026-06-28 ~ 2026-07-11)

目标:完成高优先级芯片规格收集

  • 创建数据收集追踪文件
  • 收集昇腾910C规格(FP16 ~800 TFLOPS)
  • 收集B200/GB200完整规格
  • 收集2026 Q1市场份额数据
  • 收集邃思2.0/T21规格
  • 收集昆仑芯R200规格
  • 收集天垓150详细规格 ← 进行中
  • 更新昇腾910C页面(FP16更新为800 TFLOPS)

Week 3-4(2026-07-12 ~ 2026-07-25)

目标:完成市场数据和生态对比

  • 搜索2026年H1出货量数据
  • 收集软件栈和生态对比资料
  • 创建各芯片对比表格草稿

Week 5-8(2026-07-26 ~ 2026-08-22)

目标:补充遗漏数据,开始文章撰写

  • 收集主要客户采购案例
  • 收集实际部署性能测试数据
  • 关注各厂商新品发布和技术发布会
  • 完成文章第一章(引言)草稿

🔗 数据来源记录

已使用的来源

  1. Lennart Heim昇腾910C分析 - 知乎转载

  2. NVIDIA B200关键技术解读 - 知乎

  3. 国产AI芯片份额首破50% - 百度百家号

  4. 邃思2.0百度百科 - 百度百科

  5. 昆仑芯R200技术规格解析 - 知乎

  6. 天垓150产品文档 - 模力方舟

待验证的数据

  • ⚠️ 昇腾910C FP16 ~800 TFLOPS:需要寻找更多来源验证
  • ⚠️ 国产芯片市场份额52.3%:需要IDC或工信部官方数据验证
  • ⚠️ B200 FP16 2,250 TFLOPS:需要官方白皮书或可靠评测验证
  • ❓ 天垓150 FP32/FP16/INT8算力:官方未公布,急需补充

📝 数据更新日志

2026-06-28

新增数据

  • ✅ 昇腾910C:FP16更新为~800 TFLOPS(之前误写为376 TFLOPS)
  • ✅ 昇腾910C:内存带宽更新为~3.2 TB/s
  • ✅ B200:完整规格(晶体管、FP16、显存、带宽、TDP)
  • ✅ 2026 Q1市场份额数据:国产52.3%、NVIDIA 42.7%
  • ✅ 邃思2.0/T21:完整规格(FP32 40 TFLOPS、TF32 160 TFLOPS等)
  • ✅ 昆仑芯R200:完整规格(FP32 32 TFLOPS、FP16 128 TFLOPS等)
  • ✅ 天垓150:基础信息(64GB HBM2e、350W TDP、7nm)
  • ✅ 清微智能:公司信息和产品定位

待验证

  • ❓ 昇腾910C FP32算力:推算~320 TFLOPS,需证实
  • ❓ 天垓150 FP32/FP16/INT8算力:官方未公布,急需补充
  • ❓ 燧原T21 TDP:未找到官方数据

下一步

  • 继续收集天垓150、瀚博SG100等国产芯片规格
  • 验证已收集数据的准确性
  • 更新网站现有芯片页面(如昇腾910C FP16数据)

📊 数据完整度评估

国产芯片(对比表需要)

芯片FP32FP16INT8显存带宽TDP完整度
昇腾910C❓ 推算✅ ~800✅ 64GB✅ ~3.2✅ 310W60%
MLU690✅ 150✅ 600✅ 1200✅ 64GB❓ ~2TB✅ 280W80%
天垓150✅ 64GB✅ 350W30%
燧原T21✅ 40❓ 推测~160✅ 256✅ 64GB✅ 1.8TB❓ ~300W70%
昆仑芯R200✅ 32✅ 128✅ 256✅ 16/32GB✅ 512GB✅ 150W90%

国际芯片(对比表需要)

芯片FP32FP16INT8显存带宽TDP完整度
H100✅ 60✅ 989✅ 1979✅ 80GB✅ 3.35TB✅ 700W100%
H200✅ 60✅ 989✅ 1979✅ 141GB✅ 4.8TB✅ 700W100%
B200✅ 80✅ 2250✅ 4500✅ 192GB✅ 8TB✅ 1000W100%
MI300X✅ 163✅ 1271✅ 2542✅ 192GB❓ ~5.3TB✅ 750W90%

总结

  • ✅ 国际芯片数据完整度高(90-100%)
  • ⚠️ 国产芯片数据完整度中等(30-90%),天垓150最缺失
  • 🔴 急需补充:天垓150算力数据、昇腾910C FP32官方数据

备注

  • 置信度说明:=官方数据或可靠评测,=多家来源交叉验证,=单一来源或推算
  • 所有数据在使用前需注明来源和置信度
  • 文章发布前需再次验证所有关键数据