《Wintel生态壁垒是否会在AI芯片领域重演.docx》由会员分享,可在线阅读,更多相关《Wintel生态壁垒是否会在AI芯片领域重演.docx(38页珍藏版)》请在第一文库网上搜索。
1、1 .AI芯片的竞争点不止是芯片本身72 .前车之鉴:PC时代的Wintel联盟82.1 五次失败的冲击:五种不同的致命失误102.2 两次成功的冲击:AMD的崛起+苹果封闭生态的建立172.3 总结:不能做错什么?应该做对什么? 223 .AI芯片生态壁垒如何破局? 233.1 AI生态与PC生态的相同和不同 233.2 各家所选取的AI生态突围路线303.3 后记:生态壁垒是现在的阻碍,但不是永远的阻碍35表目录图1:在主流的芯片设计中,随工艺节点的演进,设计成本变化的趋势和分布(不包括生产成本)7图2 :智能计算系统体系结构层次 7图3 : IUCPU/GPU/DLP为基础的计算系统所对
2、应的体系结构以及各软件层编程语言8图4 :各厂商PC收入(1977-1984年)9图5:自1984年起,PC产业正式开启Wintel时代9图6 : IBM、苹果和克隆机厂商PC市场份额变化(1981-1994年) 11图7 :从1988年开始出现了各种版本的UNIX操作系统 12图8 :苹果历代PC产品演进(1976-2005年)13图9 :苹果在上世纪90年代曾陷入亏损低迷期 15图10 :历年代表性电脑价格:苹果PC定价偏高15图11 : RISC (精简指令集)在上世纪90年代曾极一时16图12: MIPS和ARM商业模式以及定价、生态策略对比17图13:英特尔和AMD历年微架构迭代时间
3、轴(1993-2008年)18图14: PC旗舰级CPU跑分:2003-2P06年AMD性能领先于英特尔19图15 : PC旗舰级CPU分:2006年7月英特尔推出酷睿2之后,直至2017年英特尔相较于AMD一直保持领先优势 19图16 :英特尔自2006-2015年期间严格执行TickTock战略,2016年起由于工艺制程问题限于停滞19图17: AMD发布的第一代锐龙架构相较于上一代架构性能有大幅提升20图18 : 2018年AMD第二代锐龙架构已经进入7nm制程20图19 : PC旗舰级CPU跑分:2017年3月AMD推出锐龙架构,性能开始超越英特尔20图20 :截至2021年8月最新C
4、PU性能天梯图(最顶部):AMD仍然领先于英特尔20图21 :台式电脑CPU市场份额变化21图22 :笔记本电脑CPU市场份额变化21图23 : 2012年底各类OS生态应用软件数量2121图24 : MacOS X市占率变化(2004-2008年)图25 :冲击Wintel的成功和失败案例原因汇总23图26 :算法开发的三个阶段以及对应的智能计算系统结构 23图27 :高层算子需要调用CUDA Kernel函数这样的底层算子原语24图28 :经深度学习框架厂商特别优化后的算子有时比cuDNN直接提供的算子运行更快(以Softmax算子为例,OneFlow为国产深度学习框架)24图29: NV
5、的软件栈抽象层次(NV的智能编程语言是CUDA) 25图30 :不同AI芯片指令集不同,因此智能编程语言互不兼容25图31 :深度学习编译器借鉴了传统编译器原理(传统编译器以LLVM为例).2627图32 :用于深度神经网络的通用编译框架(虚线框中为算子优化)图33 :常用深度学习编译器对比28图34 :使用TVM编译器在某些模型端到端推理性能上能获得3倍以上加速.28图35 :使用TVM编译器在跨硬件平台时性能表现28图36 : Tensorflow和Pytorch是目前最主流的深度学习框架29图37:每年各AI顶级研究会议所接收的PyTorch论文数占TensorFlow和PyTorch的
6、论文数总和的比率 29图38 : AMD的ROCm是和英伟达CUDA对等的智能编程语言31图39 : AMD的HIPify工具可以将英伟达CUDA代码转换为ROCm代码.31图40:英伟达的CUDA栈31图 41: AMD 的 ROCm 栈31图42 :华为在AI领域全栈自研:从底层芯片到智能编程语言再到深度学习框架34图43 : MindSpore和Pytorch结合各类芯片训练速度(单位:张/秒)34图44 :寒武纪针对原生TensorFlow的修改(深灰色部分)35图45 :寒武纪的端云一体软件栈架构 35图46 :英伟达在数据中心占据97%以上份额 36表1 : IBM PS/2系统初
7、代机的机型与配置10表2 :国内外主流深度学习框架以及支持的硬件设备25表3 :谷歌历代推理和训练芯片性能参数32表4 :英伟达主流推理和训练芯片性能参数 32表5 :华为主流推理和训练芯片性能参数33表6 :寒武纪AI芯片性能参数35表7: AI芯片行业重点公司估361.AI芯片的竞争点不止是芯片本身接触或者研究过AI芯片的投资者可能会对于这样的现象有诸多费解:黄仁勋在2019年Q3季度财报业绩电话会议提到:英伟达已经成为了一家软件公司;华为昇腾计算业务总裁许映童在2020年昇腾AI新品全球发布会上表示:昇腾AI领域目前有70%的研发人员投入到软件研发。AI芯片作为硬科技产品,为何主要厂商对
8、软件研发这么重视?甚至是连英伟达都觉得AI芯片公司本质其实是软件公司?智能计算系统分为硬件和软件两部分:从指令集到物理层是硬件部分,从应用层到指令集是软件部分大家多度关注前者关于AI芯片本身的硬件设计,而忽视了 AI芯片设计公司已经往上做到了部分软件层的事实。智能计算系统自上而下可以分为应用软件、算法、编程语言、汇编语言、机器码、指令集、微体系结构、门、计算器器件、物理层。其中指令集是智能计算系统软硬件之间的接口,AI芯片公司定义完指令集后根据指令集去设计微体系结构去支持指令集。从最上层应用软件到指令集为软件部分,从指令集到物理层为硬件部分。针对硬件部分AI芯片公司对应的设计工作包括怎样把指令
9、集做得非常快、流水线设计、运算部件怎么做、访存部件怎么做,最后需要软硬件之间的映射等大家通常理解的AI芯片设计公司需要做的工作只有上述关于AI芯片本身的硬件部分的设计;而实际上AI芯片公司还往上一直做到了编程语言为止的三层软件,这一点往往被绝大多数投资者忽视了。软件已经成为AI新芯片公司IC设计成本中最“重”的投入。根据I BS的数据,随着工艺制程的演进,主流芯片设计成本中软件将成为占比最大的投入,而Verification.Validation. IP Qualification为相较于软件投入占比依次往下。图2:智能计算系统体系结构层次图1:在主流的芯片设计中,随工艺节点的演进,设计成本变
10、化的趋势和分布(不包括生产成本)Design Cost Trends with Reduction in Feature Dimensions (Mainstream Designs)350ApplicationVaMttionPro(crtyptSoftwareArchitectureEM3O.EO0 一 oPhysicalVMteation-S-0C-65 nm45,40nm28 nm20nmi90M)(130M)(180M)(240M)Feature Dension iTfaAsistof Count.i6Unm(310F/IIU.2t5gsqv -0Programming Langua
11、geAssembly LanguageMachine Codemstnjction Set ArchitectureMicro Arc hitectufeLayers of AbstractionDevices (Transistors)2资料来源:StarryHeavensAbove公众号,IBS ,申万宏资料来源:智能计算系统,研究源研究2 .前车之鉴:PC时代的Wintel联盟英伟达靠AI软件工具链已经塑造出来了强大的生态壁垒和护城河这已经是产业界和投资界公认的事实,而且英伟达凭借这一优势一直保持数据中心AI市场97%以上绝对垄断的份额。但是相较于现状,大家更关心终局:AI软件生态壁垒是
12、否将成为永远无法跨越的鸿沟,而使得除了英伟达之外的AI芯片公司后续都没有从英伟达手中抢夺份额机会了 ?我们可以从PC时代CPU从产业初期混战到如今产业成熟这段经典的商业史中探索这一问题的启发性答案。CPU、GPU从产业角度上而言其实有诸多相似之处:龙头垄断市场(CPU由英特尔垄断;AI芯片由英伟达垄断);靠系统软件形成了极强的产业生态(英特尔+微软;英伟达靠AI软件工具链+深度学习框架)。图3 :以CPU/GPU/DLP为基础的计算系统所对应的体系结构以及各软件层编程语言各种应用软件WindowsCISCX86-CPU移动APP等超算、AI应用C 语言/C+/java/Python/Fortr
13、an/BASICAI应用Tensorflow/Pytorch/Paddle paddle/Jittor等与指令集中指令相对应,每一个CPU/GPU/DLPm器码都不同PTXGCNMLUARM-CPU资料来源:研究英特尔&AMD1975年,微处理器市场伊始,有6个主要玩家参与市场角力。彼时已经发布了 4004、8008和8080微处理器的英特尔并不被看好:大家认为英特尔的芯片不如齐洛格好,不能像摩托罗拉那样大批量生产,不如MOS Technologies的便宜,不能顶住德州仪器的价格战。20世纪70年代后期,苹果占据了小型计算机PC市场90%以上份额,I BM占据了大型计算机市场80%以上份额。
14、为了迅速抢夺PC市场份额,IBM想要在不到1年时间里就把自己的个人计算机推向市场。为了完成这一计划,IBM决定抛弃过去软硬件全自研的做法而采用开放式设计,向外采购CPU和操作系统。1980年夏天,IBM分别找到了英特尔和微软。英特尔为IBM提供了 8088中央处理器,微软为IBM设计了操作系统MS-DOS. 1981年8月,IBM个人计算机PC-XT推向市场并大获成功。自此苹果市场份额直线下滑,10年之内其份额下降至个位数。1984年,IBM推出了第二代个人计算机PC AT,里面安装了英特尔286处理器,是上一代PC计算速度的3倍,PC AT取得巨大成功,一年之内PC AT占到所有PC销量的7
15、0%以上。图4 :各厂商PC收入(1977-1984年)S7XXX)(SUO=E S)0nu33a:资料来源:IDC ,研究后续由于IBM高层认为PC只能在市场的低档产品中找到出路,随着PC声势越来越大,IBM为了避免PC吞噬其高端产品,所以停止了对PC的开发。为了保护低档小型机的销售J BM推迟发售装有英特尔386芯片的PC (因为小型机相比于386个人计算机功率大不了多少)。因此英特尔找到康柏合作,康柏在1986年首次独家推出搭载MS-DOS的386计算机( 1982年6月,康柏推出了第一台IBM兼容机),从而名声大噪,立即成为美国商业界的一个空前范例。IBM市场份额不断缩小( 1983年IBM的份额为76% , 1986年份额