《人工智能行业海外大模型专题研究.docx》由会员分享,可在线阅读,更多相关《人工智能行业海外大模型专题研究.docx(19页珍藏版)》请在第一文库网上搜索。
1、人工智能行业海外大模型专题研究OpenAI概述OpenA1:全球估值最高的人工智能创业公司OpenA1成立于2015年12月,成立的目的是让通用人工智能(Artificia1Genera11nteI1igenCe)朝着最有可能造福人类的方向发展。公司的主要创始人包括山姆奥尔特曼(SamA代man)、格雷格布罗克曼(GregBrockman)、里德霍夫曼(ReidHoffman)、杰西卡利文斯顿(Jessica1ivingston)埃隆马斯克(E1onMusk)AmazonWebServices(AWS)等。截止2023年,OPenAI拥有大约375名员工,主要面向以下三个方面:Capabi1i
2、ties,不断的提高A1的功能和能力;Safety,确保这些A1系统拥有和人类一致的价值观念;Po1icy,确保这些A1系统能够得到适当的治理。根据路透社报道,OpenA1在2023年收入数千万美元,并预计2023、2024年收入为2亿、10亿美元。截止2023年4月29日,OpenA1历史融资额超200亿美元,当前估值为290亿美元,是全球估值最高的A1初创公司。公司愿景:以最有可能造福人类的方式推进人工智能发展2015年公司成立之初的愿景是让通用人工智能(ArtifiCia1Genera1Inte11igence)朝着最有可能造福人类的方向发展,与此同时不受财务回报的约束。2023年初,公
3、司对未来发展做了进一步描述,其中提到公司目标是确保通用人工智能(在智能水平上胜过人类的A1系统)造福全人类。OpenA1融资历史:通用人工智能发展的有力保障OPenA1一共经历了7轮融资,包括种子前融资,种子轮融资,二级市场融资和企业融资,总募集资金超过200亿美元。主要投资者包括有:微软、YCombinator,科斯拉风险投资公司,里德霍夫曼基金会、红衫资本、基岩资本、安德森霍格威兹、马修布朗公司等。2019年开始,OPenA1开始对融资保持相对开放的态度,彼时公司的大语言模型正处于GPT-2迈向GPT-3的发展阶段。训练大语言模型所需要的庞大算力是公司成立之时始料未及的,公司开始接受融资同
4、时寻求与云厂商的广泛合作,与此同时也伴随着公司商业模式的变化。OpenA1商业模式2019年,为了获取大规模投资和吸引人才从而更好完成企业使命,OpenA1从非营利性企业转变为具有利润上限的营利实体OPenA11P0在新的公司结构下,OPenA1就特指现在的OPenA11P,原先的非营利实体转变为OPenA1Inco而OPenA11P则会受到OpenA1InC的董事会进行控制。在此结构下,所有的投资者和员工的经济回报都是有限的,所有超额的回报都会归OPenA1InC所有。对于第一轮投资者(FirStCIOSePartnerS)的回报上限定为了投资的100倍,后续的投资回报率会不断降低。OPen
5、A1的主要盈利模式包括:会员订阅费、AP1许可费、与微软合作带来的商业收入。OpenAI技术发展路径人工智能发展历程人工智能大致可以分为三个发展阶段:弱人工智能、强人工智能、超人工智能。弱人工智能(Weakartificia1inte11igence)或称狭义人工智能(ArHfiCiaINa1ToW1nteI1igenCe)是实现部分思维的人工智能,且仅专注于某项特定任务。弱人工智能不需要具有人类完整的认知能力,甚至是完全不具有人类所拥有的感官认知能力,只处理特定的问题。弱人工智能专注于模仿人类如何执行基本动作,例如记忆或感知事物、解决简单问题。比如:A1模型A1PhaG。战胜了顶尖的人类选手
6、,但是局限于特定问题,仍然不能被称之为强人工智能。当前人工智能技术发展处于弱人工智能相对成熟、强人工智能曙光乍现的阶段。强人工智能强人工智能也指通用人工智能(arWicia1genera1inte11igence,AGI),具备非常通用的“智能能力”,包括推理能力、规划能力、抽象思考能力、理解复杂概念的能力、快速学习的能力、从经验中学习能力等,并且在这些方面达到或超过人类水平,强人工智能是人工智能研究的主要目标之一。强人工智能的目标是创建一个能够与人类一样自适应、灵活地处理各种问题和任务的智能系统。强人工智能使得人工智能具备意识、感性、知识和自觉等人类特征,有潜力为每个人提供几乎任何认知方面的
7、帮助,可以为人类的聪明才智和创造力提供巨大助力。OpenA1技术发展路线从时间维度上看,OPenA1的研究方向大致聚焦在三个领域:强化学习领域、自然语言处理领域、多模态模型领域。在强化学习领域,OpenAI采用通用的强化学习策略来来帮助A1应对灵活多变的困难问题;在自然语言处理领域,OPenA1开辟自回归建模路径,大语言模型无需在特定领域微调也有出色的任务表现;在多模态模型领域,OpenAI围绕TranSfOrTner主架构不断增强多模态能力。OpenAI的研究方向始终关注问题的通用性解决方案,而不是聚焦在特定问题之上,与其通用人工智能的研究目标契合。OpenA1Five在多人竞技游戏中击败人
8、类顶尖选手OpenAI研究早期涉及各类游戏对战,其中包括著名的Dota2对战机器人,在2017年8月在IV1比赛中击败了世界的顶尖选手。OpenAIFive的目标是寻找最大化与人类玩家对战获胜的策略,模型训练过程中通过强化学习来实现这一目标,设置了最大化的奖励函数,奖励函数中包括:角色死亡、资源收集等与胜率相关的信号。游戏过程中,OPenA1FiVe通过程序接口和游戏进行交互,直接从游戏中获取诸如生命值、位置等具体的状态值,在获取观测到的状态后,通过1STM长短期记忆网络进行处理,之后A1反馈一个离散化的动作指令,如移动、攻击、使用技能等。从2018年6月开始,OPenA1FiVe就从Open
9、AI内部逐步进行了与人类对战的测试,直至2019年4月,OPenAIFiVe以2-0击败了职业战队OG,并在接下来的4天时间中,在线上与3193支不同的人类队伍进行了7257场比赛,达到了99.4%的胜率。Dota2复杂程度接近现实世界中的问题,OPenA1FiVe的成功证明强化学习在困难的任务当中也能够取得超越人类的表现。多模态领域的基石性模型C1IP2023年后,OPenA1开始逐步涉足多模态研究领域,2023年3月发布了图文配对模型C1IPoC1IP利用文本信息监督视觉任务自训练,训练数据集为网络搜集得到的4亿个“文本图像”对,采用ViSiOnTranSfOrmer模型和ReSNet实现
10、图像的特征提取,将不同模态的原始数据映射到统一或相似的语义空间,实现不同模态信号间的相互理解,模型在这种对应关系中学习到文本和图像这两种不同模态信息背后的内涵,为多模态的生成模型奠定了基础。C1IP在零样本学习任务上表现较好。与机器视觉中常用的先预训练然后微调不同,C1IP可以直接使用提示进行零样本学习图像分类,在某个具体下游任务上实现分类。C11P在具体的细粒度对象分类、地理定位、视频中的动作识别和OCR等27个数据集的任务中表现十分优异。未来技术展望着眼于通用人工智能的发展目标,我们预计,OPenA1的研究会沿着两个方向进一步延升:多模态能力不断提升;大模型充当A1代理、能力范围不断扩大。
11、多模态能力不断提升。GPT-4初步融入了多模态能力,具备了图像的识别和理解能力,OPenA1在图像生成方面也颇有建树,预期未来在大语言模型基础之上,也会融入图像生成等多模态能力。大模型充当A1代理,通过调用各种专业化工具进一步扩大能力范围。大语言模型未来将与搜索引擎、代码编程工具、实体机器人等专业化工具进一步深化融合,打造更强大高效的多任务解决方案,为现实世界中的复杂任务提供全面的支持,让大模型成为日常生活中的个人助理,充分释放个人创造力。大模型全面赋能微软传统业务个人办公是自然语言大模型的最佳落地场景大语言模型具备出色的文本理解与处理能力,个人办公领域涉及到大量的文本处理工作,与大语言模型的
12、优势高度契合,是大语言模型最佳落地场景。微软业务多聚焦在个人办公领域,是OPenAI的最佳合作伙伴之一。微软和OPenA1合作始于2016年,2019年7月合作关系得到进一步巩固,随后不断在Aure云、大模型模型方面加强合作。OpenAI与微软达成人工智能行业的一次双晶合作。OPenA1的通用人工智能研究需要庞大的计算能力做支撑,同样需要充足的资金支持去支付运营成本和科研人员薪酬。微软也亟待OPenA1的合作增强其A1技术实力,微软作为OPenA1先进人工智能技术的首选商业合作伙伴,获得了人工智能技术商业化的竞争力。微软分业务经营情况微软FY2023Q3的营业收入为528.57亿美元,同比增长
13、7.1%,营业利润达到223.5亿美元,同比增长9.7%,毛利率为69%。生产力及业务流程:FY2023Q3营业收入175.2亿美元,同比增长10.9%。得益于Office365copi1ot的推出,Office365Commerica1营收同比增长14%,用户量增加11%,而Microsoft365的订阅量达到6540万,同比增长12%。DynamiCS产品营收同比增长25%。智能云业务:FY2023Q3营业收入220.8亿美元,同比增长15.9%,其中AZUre和其他云服务收入增长27%。个人计算业务:2023Q3营业收入132.6亿美元,同比降低8.7%。受PC需求疲软影响,WindoW
14、SoEM收入和设备收入分别减少28%和30%oNewBing的推出带来了搜索量和用户量的提升叠加收购Xandr,搜索和新闻广告业务收入同比增长10%oOpenAI助力Azure云增强其生态优势和协同效应MicrosoftAzure云具备较强的生态优势和协同效应。Azure云提供Office365Dynamics1inked1n等Saas化服务,微软IaaS、PaaSSaaS各产品均采用同类数据模型,形成较强的协同优势。近期,Azure云市场份额占比持续不断上升。OpenAI与MicrosoftAzure云深度融合之后,实现了其SaaS化服务的全面赋能。通过将大模型能力融入OffiCe365、D
15、ynamics1inkedIn等产品,不断增强其丰富生态下的产品能力。AZUreOPenA1同时提供大模型的全栈式工具,其中包括预训练的大模型、大模型的应用微调、用于检测和减轻人工智能有害输出的工具、基于用户的访问控制和专用网络的企业级安全性保障。全栈工具促进企业级应用与大模型的结合,进一步增强云上业务的协同优势。Dynamics365通过大模型进一步实现企业运行的降本增效Dynamics365是微软面对企业现代化需求推出的智能化应用组合。Dynamics365融合企业的销售业务和信息管理服务,统一整合DynamicsCRM和DynamiCSNAERP等产品,有效连接组织架构下的人员、数据和操
16、作流程,降低企业的运行成本并且简化了商业流程。大模型助力DynamiCS365COPi1Ot实现企业运行的降本增效。CRM(客户关系管理)、ERP(企业资源管理)系统中经常需要执行繁琐的任务操作,比如数据的手工输入、内容生成和事实记录。微软率先将大语言模型与其CRM、ERP系统进行融合,帮助用户实现任务自动化、提供工作创意、并获得见解,从而快速推进交易、深入理解客户需求,提升客户问题的响应速度。例如DynamiCS365下的VivaSaIes,允许卖家使用Microsoft365和MicrosoftTeams自动将数据捕获到CRM系统中,消除了手动数据输入,同时通过A1推荐最佳的营销行动,缩短整个销售周期,ViVaSaIeS用户每月收费40美元。OpenAI打开AI应用新局面GPT-4显著提升代码编程效率和质量GPT4可以根据需求自动生成、修改、优化代码,提高编程的效率和质量。以往在编程过程中,程序员需要经历搜索相