《AIGC产业链北京市专精特新企业图谱.docx》由会员分享,可在线阅读,更多相关《AIGC产业链北京市专精特新企业图谱.docx(41页珍藏版)》请在第一文库网上搜索。
1、北京市中小企业服务中心AIGC产业链北京专精特新企业图谱I北京股权交易中心BeijingEquityTradingCenter新京报贝壳财经-A1GC亍业概况IChatGPT成为行业发展里程碑2023年11月30日,OpenA1推出对话式通用人工智能工具一ChatGPT,凭借其出色的语言理解、生成和知识推理能力在上线5天后活跃用户数就达到了100万,在2个月内活跃用户数达1个亿,成为历史上用户数量增长最快的消费者应用程序,受到各国政府、企业界、学术界的广泛关注,推动A1GC行业迈出了开拓性的一步。图:AI根据指令生成文字内容只请为我介绍专精特新企业专精特新企业是指具有,专业化、精细化、特色化、
2、新颖化特征的中小企业。这些企业专注于某个产业链环节或产品.拥有高水平的专业化生产、服务和协作配套能力,为大企业和产业链提供零部件和配套产及服务。它门注重精细化生产、管理和服务,以高品房、高性价t匕的产品和服务在细分市场中占据优势。问时.这也企业利用特色资源,弘扬传统技艺和地域文化,采用独特工艺、技术、配方或原料,研制生产具有地方或企业特色的产品。此外,专精特新企业还积极开展技术创新、管理创新和商业模式创新,培育新的增长点,形成新的竞争优势,专精特新企业是优质中小企业的基础力量,其中优秀的企业被称为专精特新“小巨人“企业以上内容为A1生成,不代衰开发者立场,请勿班除或棒改本标记图:A1根据指令生
3、成图片内容图:AI根据指令生成图片内容I什么是AIGC?AIGC(AI-GeeratedContent),生成式人工智能,指利用人工智能技术生成的数字内容,包括文本、图像、音视频、代码等形式,属于人工智能技术催生的新兴行业。AIGC是基于自然语言处理、生成任务算法、预训练大模型、多模态技术融合的前沿人工智能技术,通过数据训练寻找规律,利用泛化能力输出使用者需要的内容。I中国A1GC行业市场规模根据量子位智库测算,到2030年中国AIGC行业市场规模将达1.15万亿元。250中国A1GC市场规模年复合增长率231%20015010050020242025202620272028202920302
4、02711491亿元202920组AIGC行业广受政策支持2023.05北京市经济和信息化局发布北京市通用人工智能产业创新伙伴计划汇聚产业链上下游合作伙伴,构建政产学研用深度融合的协同联动产业体系,赋能千行百业数智化转型,助力全球数字经济标杆城市建设2023.05北京市人民政府办公厅印发北京市促进通用人工智能创新发展的若干措施着力发挥本市算力资源优势,实施算力伙伴计划,为创新主体提供多元化优质普惠算力,保障人工智能技术创新和产品研发算力需求2023.06北京市委、市政府印发关于更好发挥数据要素作用进一步加快发展数字经济的实施意见提出培育人工智能生成内容产业发展,发展人工智能生成语音、图像和自然
5、语言等内丰福合2023.07国家7部门印发生成式人工智能服务管理暂行办法国家首个面向生成式人工智能行业的规范性政策2023.07北京市海淀区人民政府印发关于加快中关村科学城人工智能大模型创新发展的若干措施提出强化布局大模型软硬件技术体系;建设公共算力,降低大模型研发成本;探索数据利益共享机制;推动大模型赋能实体经济,加快产业重塑03.数据标注04.模型开发对数据进行标注,以便训练模型时能够使用。例如,可以为每个单词标注词性、命名实解码器等。ChatGPT使用的是Transformer模型,是一种基于自注意力机制的深度神经网络模型07.数据评估08,模型交互.碘I1练好的模型进行诩,检查其性能是
6、否的预期。可以使用一些指标,如准确率、召回率等来评估模型的性能将训解好的模型部署到服务器上,以便用户可以与模型进行交互I开发ChatGPT具体步骤拆解01.数据收集02.数据清洗收集大自然语言文本数据,如书籍、网络信息等。这些数据将用于训练ChatGPT的语言模型对收集到的数据进彳亍青洗,去除掉无用的信息05.模型预训练06.模型微调在大批本数据上谢亍模型预训练,但没有特定的任务目标,目的是让模型学会理解语言的结构、语义和一些基本的知识。训练过程中需要使用大的算力资源,如搭载GPU的A1服务器。训练时间长达几天甚至几周微调的目的是使预训练模型适应特定任务,例如情感分析、机器翻译等。在微调期间,
7、模型将一小部分的训练数据(例如,带有情感标签的文本、源语言和目标语言的对应文本等)作为输入,并利用这些数据优化模型参数基于市场数据和经济指标,生成投资组合策略,优化风险和回报的平衡,提供金融投资意见。通过模拟和预测药物分子的结构和性质,提高药物研发的效率和成功率。Iaigc重点发展行业自动驾驶自用于车辆感知、路径规划和驾驶决自然语言处理和计算机视觉当寺万面用于文本生成、机与生成、视频分析驾驶车辆的安全性釉亍3蛾率。AIGC产业链北京市专精特新企业情况Iaigc产业链分层应用层包括各种使用A1GC技术的应用程序和产品,例如,聊天机器人、智能客服、智能证件照等,是AIGC行业的商业化落地途径全一釜
8、一为AIGC产业链提供底层硬件算力支撑,包括用于训练和部署模型的A1芯片、A1服务器等计算设备,使模型能快速训练和优化北京A1企业数量居全国各省市第一数据来源:中国新一代人工智能发展战略研究院发布的2023中国新一代人工智能科技产业发展报告I北京有57家专精特新企业处在A1GC产业链算力层数据层模型层应用层数据来源:北京市经济和信息化局I算力层:价值占比最高算力占据A1GC产业链约65%的成本,数据及模型算法占据剩下35%的成本。I算力层:算力存在明显短缺情况2019&根据浪潮预测,未来五年内,智能算力需求的年均复合增长率为47.5%,算力存在明显短缺情况。202320232023到2026年
9、中国智能算力需求规模为2023EEF1aOPS2024E2025E2026E2004006008001000120014000I算力层:A1芯片领域被“卡”A1芯片是算力硬件中的核心,价值占据算力成本的50%以上,目前以GPU为主C芯片领域存在严重的“卡脖子”问I大的差距,因此我国A1中高算力GPU市场基本被美国英伟达公司垄断,而美国政府禁止英伟达向中国出口其尖端人工智能芯片,涉及AIO0、H100等型号,国产GPU在性能和良率方面存在较被卡个吕A1数据中心机柜8个英伟达A1OOGPU作为核心部件多个英伟达DGXA100A1服务器作为核心部件I,企业平均营收1.82元I算力层:北京专精特新企业
10、情况在A1GC行业的算力层,有14家北京市专精特新企业深耕领域,具有较强竞争实力,他们平均每家拥有发明专利16个,平均深耕行业8年以上,平均营业收入超1.8亿元。算力层:有代表性的北京专精特新企业摩尔线程MRETHREADS中科驭数YUSUR算中包二阐SOPHGO中科驭数算能科技清微智能持。公司曾获国家技术发明奖、中国专利金奖、科学技术奖技术发明一等奖等多个奖项。清微智能TSINGMICRO摩尔线程由前英伟达全球副总裁张建中创立,国内为数不多能够覆盖GPU研发设计、生产制造、市场销售、服务支持等完整流程的创业公司,并于2023年发布首颗国产全功能GPU,能够为A1大模型提供强大计算加速能力。截
11、至目前,摩尔线程估值超150亿元,迈入独角兽行列。国内DPU芯片领域唯一拥有自研核心架构能力的企业,被评为中国信科“潜在独角兽”。DPU是继CPU、GPU之后,数据中心场景中的第三颗重要的算力芯片。中科驭数在芯片领域有近二十年的技术积累,至今已讲行三代DPf芯片的研发迭代。核心团队来自清华大学,公司专注于可重构计算(CGRA)芯片的研发和创新,为A1训练、推理,N1P,自动驾驶,生物计算等通用计算场景提供高性能算力支国内领先的通用算力提供商,专注A1RISC-VCPU等算力产品的研发和推广应用,为智算中心、智能制造、ZGC等应用场景提供算力产品及整体解决方案自2016年以来旗下品牌算丰SOPH
12、ON系列产品已完成多次迭代每代产品相较于前代产品均实现能耗比倍数级提升。I数据层:数据是A1GC行业的“能源”r谷歌1TransformerI2017.06jChatGPT12023.11谷歌首次提出Transformer架构,成为GPT模型的基础。利用大规模无标注文本,基TTrans-former解码器部分,先训练生成语言模型,再根据具体下游任务进行微调.在大规模无标注文本语料上训练的GPT模型,在Zero-Shot零样本条件下完成N1P任务。将GPT的参数量扩充至1750亿,利用上下文学习在小样本Few-shotft务上取得优异性能。利用人类反馈的强化学习方法来增强模型的对话能力,成为现象
13、级人工智能应用。性能进一步得到增强,增加图像识别能九输出内容准确度、创意度提升。参数规模1亿训练数据规模5GB参数规模1.17亿训练数据规模5GB参数规模15亿训练数据规模40GB参数规模1750亿训练数据规模45TB参数规模基于GPT-3训练数据规模基于GPT3参数规模未知训练数据规模未知I数据层:数据集环节存在“堵点”存在“堵点”。斯坦福大学吴恩达教授提出二八定律:80%的数据+20%的模型二更好的A1二更好的A180%的数据20%的模型当前,主流数据集多以英文为主,中文数据集紧缺。根据360分析,中文语料数据集占比低于5%。此外,中文预料数据集质量差,数据集种类和内容缺乏多元化,专用领域
14、数据集基本空白,在政府、医学、金融等公共领域的开源数据稀缺。对比之下,美国拥有大量的文本、目标检测数据集。因此,中I数据层:我国AI数据服务市场规模持续扩容o.1Z12080604020259元201820192023艾瑞咨询数据显示,我国A1基础数据服务行业市场规模预计将从2018年的25.9亿元增长至2025年的101.1亿元,CAGR为21.5%。2023E20232023E2024E2025E平均研发强度20%平均营收增长率60%平均软著数量50I数据层:北京专精特新企业情况在A1GC行业的数据服务领域,有11家北京市专精特新企业处于行业领先地位,平均研发强度超20%(研发投入/营业收入),营收增长率超30%,平均每家企业软件著作权数量超50个。SpeechzceanI海天瑞声5据堂海天瑞声数据堂晴数智慧2V必STARDUS1星尘数据