《北京市人工智能行业大模型创新应用白皮书(2023年).docx》由会员分享,可在线阅读,更多相关《北京市人工智能行业大模型创新应用白皮书(2023年).docx(62页珍藏版)》请在第一文库网上搜索。
1、编写说明1魁2一、全球大模型发展整体态势4二、国内外大模型行业应用概述8(一)国外大模型行业应用情况8(二)我国大模型行业应用情况11三、北京市大模型行业应用情况18(一)北京市大模型产业发展情况18(二)北京市大模型行业应用特点19(三)大模型行业应用典型案例221 .政务领域232 .金融领域293 .医疗领域344 .传统产业赋能领域415 .文化旅游领域466 .智慧城市领域53(四)北京市大模型行业应用面临的挑战59四、下一步建议61结语64致谢声明65综述作为新一轮科技革命和产业变革的核心引擎,人工智能正在为经济社会发展持续注入新动能,今年以来,大模型技术引领着人工智能领域迈入新发
2、展高度,在世界范围内受到广泛关注。大模型对于人工智能厂商和企业用户而言,是一个重要发展机遇。人工智能厂商方面,谷歌、微软、Meta.亚马逊等全球科技巨头将大模型视为重要发展机遇,积极投入并且大动作频发。我国众多厂商也投身大模型领域,包括百度、阿里、腾讯等互联网大厂,科大讯飞、商汤科技、旷视科技等垂直于A1领域的厂商,以及智谱华章、百川智能、MiniMaX等大模型初创企业。市场上也不乏高校、研究机构的身影,清华大学、中国科学院自动化所、北京智源人工智能研究院等发布了各自的大模型成果。企业用户方面,大模型在企业侧的应用速度之快超乎想象。2023年初,企业管理层对大模型的话题还停留在大模型是什么,是
3、不是概念炒作。短短半年,大模型已经从饭后谈资走向落地应用。大企业管理层关于大模型的对话变得比之前复杂很多,他们希望了解到大模型能为企业发展带来哪些变革,大模型的应用路径是什么,如何提升大模型的投资回报率,以及应该为拥抱大模型做哪些准备。而且,大模型吸引的人群也愈发广泛,不仅吸引CIO、CTO等技术管理者的关注,CEO、CMO等非技术类管理者同样期待大模型在业务中发挥价值。这些转变表明,大模型的变革之力正日益得到产业界的认可。从传统行业到高科技行业,从行业黑马到行业龙头,诸多企业开始论证或试点应用大模型,期望在客户运营、软件开发、营销推动等领域有所提升,进而增强市场竞争力。通过对市场规模数据的分
4、析,能较为直观地体现出企业对大模型应用落地的热情。根据数字化市场的研究咨询机构北京爱分析科技有限公司相关报告显示,2023年中国大模型市场规模约为50亿元(人民币,下同)。2023年,企业在大模型方面的采购特点是论证多、采购少,各企业计划在2024年开始大量释放大模型预算,因此市场规模将大幅增长,预计达到120亿元。本报告基于前期对北京市人工智能行业大模型创新应用案例研究的情况,按照领域分类,以政务、金融、医疗、传统产业赋能、文化旅游和智慧城市等六大领域为切入点,并从应用案例的业务背景、共性痛点、大模型解决方案等角度展开系统分析,聚焦创新性、示范性、经济与社会效益、可推广性等四个维度,选取18
5、个具有代表性的应用案例深入调研,力求为相关领域开展应用场景建设提供参考。一、全球大模型发展整体态势(一)大模型推动智能“涌现”,打开A1技术发展上限人工智能大模型,是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的模型。在技术层面上,大模型的实现采用“预训练+指令微调+人类反馈的强化学习”的训练范式。首先通过预训练技术将深度学习网络在海量数据上进行自监督训练,然后利用指令数据进行有监督指令微调,提升模型对人类指令的追随能力,最后,基于由人类价值标注数据训练得到的奖励模型所提供的奖励信息进行强化学习,控制大模型的输入符合人类价值判断。在大模型使用时,通过设计提示进行即时学习可
6、以进一步提升大模型完成各类任务的能力。规模化是使大模型强大的重要原因,研究表明当模型规模足够大的时候,会涌现”智能能力,具备处理新的、更高层次的特征和模式的能力,能够为一系列下游任务带来更好的任务效果。大模型不断扩大的规模由“量变”引发质变”,模型通用认知能力不断提升。大模型能力的迅速发展不仅有助于人类完成“规定动作”,还可能帮助人类去研究和发现未知领域,突破人类过去没有突破过的极限。大模型的技术变革呈现数据巨量化、模型通用化、应用模式中心化的特点。整个发展历程可划分为三个阶段。2013-2018年的深度学习阶段,主要还是基于传统的“针对特定任务的专用模型+大量标注数据”方式,在监督学习的机制
7、下训练得到一个个专用小模型,但是在词向量的自监督学习中,使用大规模数据进行预训练的方法已初见端倪,2017年TranSformer的提出为基础架构带来了规模化构建和规模化运算的潜力。TranSfOrmer解决了RNN和1STM的并行化训练和长距离依赖问题,解决了CNN的局部归纳偏差问题,能够容纳更多的参数规模,并且具备更强的语义特征提取能力、长距离特征捕获能力、综合特征提取能力。2018年-2023年的预训练阶段,基于“海量无标注数据”,在自监督学习机制下获得预训练大模型,通过少量标注数据微调后得到领域专用模型。自监督学习机制的成功使得可利用的数据愈发“巨量化”,从标注数据拓展到无标注数据。B
8、ert将可利用的预训练数据量扩大3到5倍,成为自然语言理解任务中的基准模型。自此,“预训练+微调”的学习范式成为主流。在通用大模型上通过少量标注数据微调,即可适用于一系列下游任务。2023年下半年以来的大语言模型阶段,预训练大模型的通用能力愈发强大,引入指令监督训练使得模型能更好地追随人类指令完成各种任务,并提升了在下游任务上的泛化能力,通过人类反馈学习让机器与人类价值对齐成为可能。(二)大模型变革内容生产和技术服务模式,“无限生产”推动生产效率颠覆式提升内容生产方面,生成式大模型率先在内容创作、图像生成、数字人、游戏等娱乐媒体领域广泛应用,内容生产效率和质量显著提升,内容生产模式从辅助人到“
9、替代”人演变。据Gartner预测,至2023年底,将有20%的内容被生成式大模型所创建;至2025年底,生成式大模型产生的数据将占所有数据的10%。技术服务方面,大模型的“无限生产”能力重塑企业生产引擎。随着大模型能力的不断提升,AIAgent成为重要发展趋势,未来,大模型将不仅仅是一种生产工具,更多是作为企业“合作者”,持续为企业注入生产动能。(三)大模型作为新的“根”基础设施,驱动A1范式变革大模型实现模型生产从“作坊式”到“流水线”的升级。大模型出现以前,AI模型是定制化、场景化”的开发方式,针对特定应用场景需求训练一个个小模型,模型难以复用和积累,导致A1落地的高门槛、高成本与低效率
10、。大模型实现基础模型底座的标准化开发和泛在化应用,解决成本困境。通用大模型通过从海量的、多场景、多领域的数据中学习共性知识,成为具有通用性和泛化能力的模型底座。基于通用大模型底座可搭建各行业的垂类大模型,可以有效缩减垂类大模型训练所需要的算力和数据量,缩短模型的开发周期,提升垂直领域的应用开发效率。OPenA1以GPT4通用大模型为底座,通过快速增量训练和个性化微调的方式,允许普通用户通过简易对话界面自定义定制GPT,支持开发者采用私有数据对GPT进行个性化微调,使大模型更易于访问和开发,产品形态更加丰富,以满足更广泛的市场需求。(四)中美是大模型技术领域的主要“玩家”,大模型市场竞争持续深入
11、2023年5月发布的中国人工智能大模型地图研究报告指出,美国和中国发布的通用大模型总数已占全球发布量的80%o美国方面,形成了OPenA1+微软、Meta、谷歌等多个“阵营、OpenAI重点围绕GPT4底座模型完善上层开发者生态,Meta通过开源11aMa等大模型,引领了全球大模型开源浪潮。我国方面,大模型再次诠释中国速度。截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余省市/地区。中国工程院院士郑纬民指出,美国作为全球科技霸主,一直引领人工智能领域发展前沿,整个大模型的产业布局全面领先,在研发能力、人才储备、硬件设施及融资环境方面占据优势。相较而言
12、,中国占据海量数据资源和应用场景优势,但顶尖的AI人才缺乏,在基础理论、原创模型等颠覆型、阶跃型技术方面仍缺乏引领能力。产业基础层的整体实力较弱,高质量数据积累不足,在高端芯片、关键基础软件等领域受制于美国。二、国内外大模型行业应用概述(一)国外大模型行业应用情况美国大模型商业化应用进展全球领先,商业化进展迅速。一是网络、存储等基础设施建设完备,技术发展成熟,为大模型广泛应用打下良好基础。二是具备充足的用于大模型训练推理的高端芯片,算力充沛。三是大模型技术领先,以OpenAI为代表的大模型公司对美国大模型在全球取得领先地位和广泛落地起到重要推动作用。OPenA1作为全球人工智能顶尖研究机构,以
13、GPT4为底座,为个人、开发者和企业大模型应用持续赋能,其近期推出的GPTStOre为大模型应用带来爆发式增长。据不完全统计,美国大模型应用已经覆盖医疗、金融、房地产、媒体、军事、气候预测等领域,如微软将GPT4能力集成到。ff1ce等办公软件中,提高办公效率和用户体验;摩根士丹利也接入GPT4能力,优化财富管理咨询流程;房地产服务商R的大模型工具可根据用户提示自动生成房屋图像以及进行房源匹配;报纸出版商Gannett将大模型集成到出版系统中,简化运营,帮助记者摆脱日常繁琐任务、解放生产力。欧盟、英国、加拿大、新加坡、日本、印度等国家和地区的大模型应用尚处于前期尝试阶段,仅个别头部企业开始应用
14、。在英国,会计、法律等行业的国际知名企业在部署大模型,如普华永道已在英国员工测试使用尽职调查、识别合规问题、审批交易等功能,未来将面向全球推广;英国最大律师事务所之一麦克法兰宣布,与法律领域生成式AI企业Harvey达成技术合作,将在法律咨询、法律内容生成/查询、客户服务等领域全面应用生成式AIo在日本,7-11连锁便利店将大模型用于产品创意和规划,提升产品研发效率;本田汽车将大模型用于汽车设计。在印度,教育科技企业PhysicsWa11ah宣布引入AIakhA1平台,该平台将协助学生进行小组学习、解决学术和生活问题、提供支持和鼓励,甚至创建个性化的学习计划。表格1国外部分大模型应用案例国家应
15、用内容美国微软正式发布MiCre)SOft365COPi1Ot,集成GPT-4功能,以聊天机器人的模式集成在微软的多个程序如WOrc1、Exce1PowerPointOut1ooksTeamS中。用户可通过简短指令,自动生成文字、表格、演示文稿等内容。2023年,彭博社发布了专门为金融领域打造的大型语言模型(11M)B1oombergGPTo该模型整合彭博终端上的大量可用数据,协助改进现有的金融N1P任务,例如情感分析、命名实体识另1、新闻分类和问答等。PaIantir发布人工智能平台AIP,通过集成大语言模型实现作战数据协同、行动方案建议等,为作战指挥提供快速方案并优化后勤保障管理。美国SC
16、a1eAI公司与美国海军陆战队大学联合研发HenneS大语言模型,旨在测试该模型在战役级作战规划方面的能力。使用者可以通过使用“Hermes军事规划大型语言模型”全面理解对手的治国战略,从而制定更为精密的作战策略。这一大语言模型的应用有助于军事规划者从多个维度更全面地观察战场情势。IBM和NASA在HUggingFaCe上开源全球最大的地理空间大模型PrithvioPrithVi由NASA提供大量地理、气候、灾害等卫星遥感数据,在IBM的WatSOnx.ai模型上预训练、微调而成。PrithVi主要用于预测气候变化、洪水映射、跟踪森林砍伐、预测作物产量等,全球金融科技龙头企业BrOadridge的全资子公司1TX在官网宣布,推出BondGPT+,用于分析20000多种债券。BondGPT