《计算机行业2023年6月投资策略报告:AI大模型发展新趋势关注AI应用+监管.docx》由会员分享,可在线阅读,更多相关《计算机行业2023年6月投资策略报告:AI大模型发展新趋势关注AI应用+监管.docx(14页珍藏版)》请在第一文库网上搜索。
1、计算机行业2023年6月投资策略A1大模型发展新趋势,关注A1应用+监管内容目录A1大模型三大发展新趋势4趋势一:边缘侧4趋势二:降低模型参数量5趋势三:多模态8从一级市场看海外A1应用风向9A1海外应用落地集中在传媒游戏、机器人、办公、医药等领域9以美国为例,从一级市场看A1风向12智源大会召开,SamAItman强调A1监管+A1安全14投资建议:关注A1应用和监管领域机会14风险提示14图表目录图1:谷歌Pa1M2大模型提供4个版本,适用于不同场景4图2:Gecko(壁虎)可在手机端本地化运行4图3:OPenA1正式发布ChatGPT的IoS版本APP4图4:高通发布支持安卓手机部署超1
2、0亿参数的A1模型的手机芯片5图5:模型大小和数据量同比例(即1:1)缩放时最优5图6:Pa1M2在世界高级语言能力考试中的表现显著优于第一代Pa1M6图7:对于大多数编程语言,Pa1M2转码能力优于Pa1M7图8:OpenAICEoSamA1tman参加闭门会议8图9:MSRA提出桥塔架构(Bridge-ToWerArChitecture)多模态预训练模型(视觉-语言)8图10:23年3月谷歌发布Pa1M-E多模态大模型(视觉-语言)9图11:A1海外应用落地主要集中在传媒游戏、机器人、办公、医药领域9图12:22年美国A1领域融资项目数为574个12图13:22年美国A1领域融资金额为24
3、3.5亿美元12图14:美国风投偏好早期A1项目13图15:风投聚焦于A1软件、医药、机器人领域(单位:个)13图16:A1软件融资项目数占比持续提升,机器人基本维稳13图17:在北京召开智源大会14图18:SamAItman发表主旨演讲14表1:Pa1M2在超过100种语言的多语言文本上进行了训练6表2:Pa1M2推理能力表现优于Pa1M7表3:Pa1M2在数学领域表现大幅优于Pa1M7表4:Pa1M2代码Th成能力优于PaIm7表5:传媒游戏一百花齐放,各细分领域A1应用落地10表6:机器人E1P大模型加快A1聊天机器人落地10表7:办公-A1赋能办公软件,提升工作效率11表8:医药-药物
4、研发、医疗检查,医疗辅助领域均有A1应用落地11表9:其他-A1赋能百业,发展前景可期12A1大模型三大发展新趋势趋势一:边缘侧模型侧:23年5月,谷歌和OpenAI发力大模型边缘h1)2023年5月10日(美国时间),谷歌召开0开发者大会,发布全新的A1大模型Pa1M2,重点改进了多语言翻译、数据相关、程序语言、推理和自然语言Th成能力等。Pa1M2按照模型大小提供了4个版本,从小到大依次为Gecko(壁虎)、Otter(水獭)、BiSon(野牛)、Unicorn(独角兽)。其中,最轻量级的Gecko(壁虎)可以直接在各种智能手机设备上本地化运行,且每秒可以处理20个token,对应1677
5、个单词,基本满足移动设备用户的需要。2)2023年5月19日,OpenAI正式发布ChatGPT的IoS版本App,正式将ChatGPT接入终端边缘侧,美国iPhone用户可以通过苹果应用商店免费下载安装,此外OpenAI还承诺,未来计划将ChatGPT应用登陆Android设备。谷歌和OpenA1的部署方式不同:1)谷歌直接将Gecko(壁虎)模型部署在终端移动设备,在终端进行计算;2)OpenAI目前仍将计算部署在云端。图1:谷歌Pa1M2大模型提供4个版本,适用于不同场景Pa1M2Mode1sUmcornOtterBison资料来源:谷歌,国信证券经济研究所整理图2:Gecko(壁虎)可
6、在手机端本地化运行Workson-device,evenoff1ine图3:OpenAI正式发布ChatGPT的IoS版本APPChatGPT:getinstantanswers,findcreativeinspiration,and1earnsomethingnew.硬件侧:23年2月,高通在MWC上展示了一款基于骁龙的手机芯片,其支持Android手机上部署超过10亿参数的uStabIeDiffusionA1模型;5月3日,高通CEO表示,在未来几个月,高通有望推出支持本地运行超100亿参数A1模型的移动设备芯片。我们认为11M移动原Th或成未来趋势,主要因为:1)在移动端部署11M,不仅
7、可以降低服务成本、改善延迟,同时可以提升安全性,保护隐私;2)移动端算力持续提升,叠加大模型轻量化发展,为11M移动原Th提供了发展基础。图4:高通发布支持安卓手机部署超10亿参数的A1模型的手机芯片1B*potometergenerativeA1mode1runsefficient1yandinteractive1yontheAndroidSmortpKoneEnhoncedprivacy,security.re1iabiUty.andcostwithon-deviceprocessing1eodingQua1commA1Engine.Qua1commA1Stock&too1smokeitp
8、ossib1e资料来源:高通,国信证券经济研究所整理趋势二:降低模型参数谷歌第二代A1大模型Pa1M2叁数降低。根据CNBC数据,相较于22年谷歌发布的第一代A1大模型,Pa1M2的模型参数量下降了约1/3。谷歌通过提升模型训练数据量和数据集质量、使用计算最优缩放、更新模型架构等方法,使得Pa1M2在参数量下降的情况下,性能表现反而大幅优于第一代A1大模型,在多语种能力、推理能力、编程能力均有大幅提升。图5:模型大小和数据量同比例(即1:1)缩放时最优Nopt-CF,-0.49Dop_C*b.b-O.S1表1:Pa1M2在超过100种语言的多语言文本上进行了训练ISO代码语言占比ISO代码语言
9、占比esSpanish11.51noNorwegianO.67ZhChinese10.19ihrCroatianO.64ruRussian8.731WHebrewO.621JaJapanese7.61fetEstonian0.6frFrench6.55fbgBu1garian0.591PtPortuguese5.77fiFinnish0.581deGerman5.55fbnBengaIi0.52itIta1ian3.82fSrSerbianO.521kKorean3.61FdaDanish0.511idIndonesian3.351msMa1ay0.43iarArabic3.30VSWSwah
10、iIi0.43viVietnamese2.93It1ithuanianO.37itrTurkish2.74PfiIFiIipinoO.341P1Po1ish2.3fUZUzbek0.3faFarsi1.8停siS1ovenianO.231n1Dutch1.78fftaTamiI0.2thThai1.59kaGeorgianO.2froRomanian1.19VSqA1banian0.2CSCzech1.11Iv1atvianO.181hiHindi1.03kkKazakhO.16iukUkrainian1.O1PcaCata1an0.15huHungarianO.97faZAzerbaijan
11、iO.14SVSwedishO.91PurUrduO.14e1Greek0.88fmrMarathiO.13资料来源:GoogIe技术文档-2023-P62,国信证券经济研究所整理图6:Pa1M2在世界高级语言能力考试中的表现显著优于第一代Pa1M表2:Pa1M2推理能力表现优于Pa1M代表性推理数据集SOTAPa1MPa1M2:WinoGrande87.54,85.1b90.9ARC-C96.3,88.r95.1DROP88.470.885StrategyOA81.S81.6c90.4CSQA91.2,80.r90.4XCOPA89.98,89.9g94.4BBHard65.2,65.2,7
12、8.1资料来源:GOOg1e技术文档-Pa1M2Technica1Report-2023-P14,国信证券经济研究所整理表3:Pa1M2在数学领域表现大幅优于Pa1M:|TaskSOTAPa1MMinervaPa1M2FIarr-Pa1M2MATH5038.833.6/50.334.3/48.833.2/45.2GSM8K92.Ob56.5/74.458.8/78.580.7/91.084.7/92.2MGSM72.Oc45.9/57.972.2/87.075.9/85.8资料来源:Goog1e技术文档-Pa1M2Technica1Report-2023-P15,国信证券经济研究所整理表4:P
13、a1M2代码Th成能力优于Pa1mHumanEvaIMBpPARCADEPaSS得1PaSS100PaSS1PaSS80PaSS1passW30Pa1M2-S*37.688.450.086.616.243.6Pa1M-Coder-540B35.9,88.4,47.0,80.8,7.9,33.6,资料来源:Goog1e技术文档-Pa1M2Technica1Report-2023-P16,国信证券经济研究所整理图7:对于大多数编程语言,Pa1M2转码能力优于Pa1MFMM5408PaiMCoderUOe资料来源:GOOg1e技术文档-Pa1M2Technica1Report-2023-P17,国信
14、证券经济研究所整理OPenA1将降本作为首要任务,降低模型弁数或是未来趋势。5月中旬,OpenAICEOSamA1tman与一些开发人员和初创公司创始人闭门会面,简述了OpenAI的路线图和面临的挑战。SamA1tman表示,目前OpenAI首要任务是降低成本,通过蒸播降低大模型参数量是降低每Token成本的重要方式,降低模型参数量或是OpenAI未来发展方向。图8:OpenAICEOSamAItman参加闭门会议资料来源:Human1oop,国信证券经济研究所整理趋势三:多模态多模态模型是指将不同类型的数据(例如图像、文字、视频、语音等)结合起来进行分析处理的模型。其通过不同数据类型的相互关联和结合,可以大