为什么软硬件协同设计才是 AI 真正的 100 倍增益：SemiAnalysis 的 Dylan Patel | yai.news | yai.news

Sequoia Capital2026-06-30 12:002.1万

为什么软硬件协同设计才是 AI 真正的 100 倍增益：SemiAnalysis 的 Dylan Patel

Most Value Information / 核心价值信息

基于视频标题、描述与字幕内容提炼，只保留最有价值的信息，不对缺失信息进行臆测。

Dylan Patel 的核心论点是，AI 的最大收益来自硬件与软件协同设计，而不是单纯让芯片更快。他认为，模型架构、内核和网络拓扑决定了哪种加速器才真正最优，这削弱了简单的 GPU 对 TPU 叙事，也随着模型越来越擅长编写和优化代码而侵蚀了旧有的 CUDA 护城河。他还认为，AI 云经济与传统云经济有根本不同，这为 neoclouds 留出了空间，也削弱了超大规模云厂商的优势。更广泛的战略图景是一个更加多极化的 AI 技术栈，芯片厂商、模型实验室和专门的基础设施参与者彼此相互强化。

关键洞见

AI 性能是系统问题，而不是芯片规格问题：Patel 的主要观点是，最佳结果来自将模型、内核和硬件协同设计。即使芯片更快或更高效，如果周边软件栈和网络拓扑与模型不匹配，也不一定能赢得最终表现。
为什么重要：这会把竞争问题从“谁有最好的芯片？”转向“谁能最快优化整个技术栈？”，从而改变人们评估供应商、模型实验室和基础设施投资的方式。
合适的加速器取决于模型架构：他认为 TPU 与 GPU 并不是一场通吃式的普遍胜负对决：稀疏性、矩阵乘法形状和注意力结构等不同模型选择，可能让某个平台比另一个平台更不适配。他明确指出，类似 OpenAI 和类似 Anthropic/Google 的模型路线，可能对应不同的硬件偏好。
为什么重要：平台选择正变得与架构绑定，因此算力需求可能会在不同芯片之间分散，而不是收敛到单一标准上。
CUDA 的护城河比过去更弱：Patel 认为，随着模型越来越擅长写代码，更多内核和优化工作可以被自动化，或直接交给 AI 完成。由于真正重要的模型公司数量有限，他认为过去那种“成千上万客户都必须保持 CUDA 兼容”的前提已经不那么稳固了。
为什么重要：如果软件可移植性变得更容易，英伟达历史上的开发者锁定效应就不再那么有保护力，专用或竞争性加速器也会更容易进入市场。
AI 云经济打破了超大规模云厂商模板：他认为，许多超大规模云厂商的优势是为 CPU 云构建的：租户隔离、虚拟机监控器设计、存储优化和安全模型。在 AI 场景中，客户往往按整机架或多机架租用，并签订长期合同，因此这些传统优势的重要性下降，而原始性能和快速交付更重要。
为什么重要：这解释了为什么即便在一个长期被认为属于 Amazon、Google 和 Microsoft 的市场里，neoclouds 仍然能够存在。
快速获得算力在经济上确实有价值：Patel 强调，在一个高波动市场中，能更快交付算力的团队和公司可以捕获超额价值。他把 neocloud 运营商描述为具有直接的财务激励去快速上线产能，而大型 incumbents 中没有人会因为更快执行而获得同样直接的个人收益。
为什么重要：这有助于解释为什么精简的基础设施初创公司能在需求爆发、供给紧缺时，比更慢的巨头执行得更好。
Jensen Huang 受益于多极化的 AI 生态：Patel 认为，英伟达不希望超大规模云厂商变成唯一的权力中心，因为那最终会削弱英伟达的议价能力。支持 neoclouds 和众多模型实验室，有助于维持这样一个世界：更多客户、更多实验室和更多基础设施提供商都需要英伟达的芯片。
为什么重要：这传递出一个战略信号：英伟达的合作行为不只是销售，更是在塑造生态，以保持议价权的分散。

战略含义

从技术栈层面评估 AI 基础设施，而不是只看孤立的基准测试结果；模型方向和集群拓扑如今与芯片原始性能同样重要。
随着模型家族在架构上分化，GPU、TPU 和专用部署之间的算力需求会出现更多碎片化。
将 neoclouds 视为 AI 工作负载经济性的结构性回应，而不仅仅是供给短缺的临时替代方案。
假设主要平台厂商会主动塑造生态，以避免超大规模云厂商或模型实验室过度集中。

需要关注的信号

OpenAI、Anthropic 和 Google 是否会继续在稀疏性、注意力和专家结构上分化到足以将它们分别锁定在不同加速器上。
模型自动生成定制内核是否会在接下来的几个产品周期中，实质性降低 CUDA 兼容性的实际价值。
neoclouds 是否会继续在交付速度和机架级利用率上，胜过超大规模云厂商的 AI 产品。
英伟达是否会继续支持广泛的实验室和基础设施参与者，以维持一个多极化市场结构。

注意事项

这份访谈稿是节选版，包含被省略的中段和末段内容，因此一些论点可能缺少前后文。
若干数值引用较为随意，且未在来源中独立核实；应将其视为示意性内容，而非精确预测。
不少表述是以 Patel 的观点或战略判断形式给出的，而不是经过实证证明的结论。