《【行业研报】中国AI治理的独立思考——生成式人工智能发展与监管白皮书-南财智库-2023_市场营销策.docx》由会员分享,可在线阅读,更多相关《【行业研报】中国AI治理的独立思考——生成式人工智能发展与监管白皮书-南财智库-2023_市场营销策.docx(41页珍藏版)》请在第一文库网上搜索。
1、(2O23)SFC-南财智库访问2一财经APP智底频道获取更多报告ht-p-H1ajingjKCmHhinktankJ双相中茂律师事务所yGuantao1aWFirm中国A1治理的独立思考生成式人工智能发展与监管白皮书指导单位南方财经全J体集盲主办隼位21世纪经济报道联合出品南财合规科技研究院、观福中茂律师事务所preface1956年,在美国汉诺威小镇的达特茅斯学院,“人工智能”的概念被首次提出。此后60余年,人工智能从屏幕上显示的代码逐渐转化成实践应用。但人工智能的规模化商用并非坦途,概念的火热一直以来未能助推技术突破与商业应用。时间来到2023年,生成式A1发展为人工智能发展再注入一针强
2、心剂。先是Da1I-E2、MidjOUrney、Stab1eDiffusion等文生图应用引起广泛关注,接着ChatGPT横空出世,被视为通用人工智能的起点和强人工智能的拐点。作为里程碑式的技术进步,ChaiGPT将引发新一轮人工智能革命。人工智能发展似乎找到了自己的主流叙事。不过,技术创新的同时也带来了监管难题。如何平衡发展与安全,中国正在摸索自己的AI治理路径。在此环境下,身处其中的行业创新者、技术使用者,以及作为受众的社会公众,又该如何理解生成式AI发展的现状与前景,应对可能的风险与挑战?在此背景下,本白皮书将通过分析生成式AI的发展现状、政策导向、实操中面临的风险,以及各国的监管路径,
3、以期为未来的A1治理提供有益思路。【联合出品方】南财合规科技研究院观韬中茂律师事务所【总统筹】王俊王渝伟【撰写】王俊冯恋阁郑雪王渝伟杨欣如周丹钱雨晴温泳珊林婉娜罗洛【设计】设计统筹林军明林潢封面/图表黎旭廷版式设计陈国丽【校对】黄志明第一部分发展:生成式AI治理的第一视角/21.1生成式A1相关概念/312生成式A1发展现状/41.2. 1算力/51.3. 2大模型/512.3生成式A1应用市场/81. 3关于生成式AI的中国思考/81.1. 3.1探索优化应用场景/9CONTENT目录1.2. 2加强基础技术的自主创新/101.3. 3推动公共训练数据资源平台建设/111.4. 4豁免责任/
4、11第二部分风险:生成式AI治理的底线思维/132. 1知识产权侵权风险/132.1.1著作权侵权/13第三部分2.1.2侵犯商业秘密/14借鉴:欧美生成式AI治理的观察/212.1.3不正当竞争和反垄断风险/143.1美国/212.2算法风险/153.1.1关于人工智能的立法概况/212.2.1算法黑箱风险/153.1.2关于生成式AI应用的风险治理框架/242.2.2算法歧视风险/153.2欧盟/262.2.3算法决策风险/153.2.1关于人工智能的立法概况/262.2.4信息失真风险/163.2.2关于生成式AI应用的风险治理框架/282.3数据安全与个人信息保护风险/163.3关于美
5、国与欧盟风险治理框架的评析/312.1.2 2.3.1个人信息保护/162.1.3 数据跨境风险/182.1.4 数据安全风险/19第四部分实践:中国关于生成式AI治理的独立思考/324.1关于生成式AI的立法概况/324.2关于生成式AI应用的风险治理框架/334.3关于商业化应用中生成式AI风险治理的思考/342.4伦理道德风险/202人工智能白皮书访问21财经APP智库频道获取更多报告hupm21-g:.Hnkuink第一部分发展:生成式AI治理的第一视角2023年11月,OPenA1推出的聊天生成预训练转换器(ChatGPT)的爆火,带来了人工智能的“iPhone时刻”。该产品以强大的
6、文字处理和人机交互功能迅速风靡全球。数据显示,发布五天内其用户量就达到了100万,并在短短2个月内用户量破亿,取得现象级战绩。以ChatGPT等大语言模型为标志的生成式A1的成功,带来了新的范式革命和广阔的商业前景,资本市场持续高涨的热情也足以彰显它的价值。不过,一个硬币总有正反两面,生成式A)技术在为经济社会发展带来新机遇的同时,也引发了诸多舆论争议,带来了虚假信息传播、个人信息权益侵害、数据安全、偏见和歧视等问题。事实上,全球正在进入“生成式AI革命风暴”,随之掀起的是新一轮的AI监管潮。欧盟领先一步,人工智能法案进入最终谈判阶段。系列迹象表明,美国政府最近也在紧锣密鼓地推进监管工作:6月
7、20日,美国总统拜登就会见了AI专家和研究人员,讨论如何管理A1在就业、儿童权益、偏见和成见以及信息方面带来的机会和风险。美国政府正在考虑为这项快速发展的技术制定具有法律约束力的规定。中国人工智能法草案也将提请全国人大常委会审议。在4月发布生成式人工智能服务管理办法(征求意见稿)并向社会公众征求意见后,7月13日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局正式发布生成式人工智能服务管理暂行办法(以下简称办法)。至此,中国率先交出一份答卷,也可以视为“生成式A1时代”下中国关于A1治理的独立思考。办法彰显了中国对以生成式A1为代表的通用人工智能产业治理的基本态
8、度,与征求意见稿相比,办法不再以风险防控为主要导向,业内似乎可以打消此前的“踩刹车”顾虑。正式文件中大幅增加了促发展的内容,同时划定了底线。网信办在就办法答记者问时也提出,办法坚持目标导向和问题导向,明确了促进生成式AI技术发展的具体措施,规定了生成式AI服务的基本规范1. 1生成式AI相关概念2023年被认为是“生成式AI元年”,Da11-E2Midjourney.Stab1eDiFFusion等文生图应用的出现引起广泛关注;12月底,ChatGPT的横空出世更是使得生成式AI的风头一时无两。自1956年概念的首次提出至今,人工智能技术已发展超60年。然而,时至今日,其仍未实现大规模应用。生
9、成式AI的出现标志着人工智能进入了新纪元,机器开始能够模拟人类的创造性思维,并有望促进社会生产力的大幅跃进。生成式AI技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。基于监督学习的方法差异,机器学习领域可以分为判别式(discriminative)和生成式(generative)两种典型模型:判别式模型是对条件概率建模,学习不同类别之间的最优边界,从而完成分类任务;生成式模型则面向类建立模型,计算基于类的联合概率,然后根据贝叶斯公式分别计算条件概率,进而根据输入数据预测类别。生成式A1更强调学习归纳后的演绎创造,通过模仿式、缝合式的生成创作,不断判别和进化,从而产生全新的内
10、容,其本质是“创造未知世界”。掀起本轮AI技术浪潮的正是后者。生成式AI技术以革新产业的面貌席卷了科技界,驱动了生产流程升级转型。1 钱玉娟,参与制定者解读生成式AI新规:“发展被放到更重要的位置”,经济观察报,https:/2 国家互联网信息办公室有关负责人就生成式人工智能服务管理暂行办法答记者问,访问21财经pp智库:道获取更多报告tp二n21gh3二h,k-ank4人工智能白皮书访问21财经APP智库频道获取更多报告htEm21sj1CQmknk根据技术实现及应用路径,生成式A1又可以进一步细分为数据层、算力层、模型层和商业化应用层。数据层包括数据提供、数据分析以及标注等环节。生成式A1
11、产品的诞生需要依托海量的数据资源。公开资料显示,GPT-3模型的基础来自8000亿个单词的语料库(或45TB的文本数据),包含了1750亿个参数。“8000亿”是ChatGPT的训练数据,“1750亿”是它从这些训练数据中所学习、沉淀下来的内容。算力层是A1训练的基础设施,包括数据中心、服务器,以及高性能的A1芯片。据华泰证券测算,训练一次ChaIGPT侬(13亿参数)需要的算力约27.5PFIoPs-day,即以1万亿次每秒的速度进行计算,需要耗时27.5天;而ChatGPT单月运营需要算力约4874.4PFIOPs-day模型层位于生成式A1的中游,是生成式AI得以实现的关键环节。生成式A
12、I的成型得益于2014年以来GAN(生成对抗网络模型)、TransFormer(转换器模型)、DiFFusion(扩散模型)等模型的发展与融合。例如,基于多种底层的A1技术,OPenA1公司经过多次迭代的GPT-4模型,谷歌对标GPT-4的大模型Pa1M2等,通过开放API调用,可以赋能各类垂直应用厂商。商业化应用层则涵盖文本、音频、图片、影片的生成等,是产业链的最下游,但也是A1能否大规模应用、能否真正创造价值的关键。根据Pi1chBook的统计数据,2023年投资圈向生成式AI公司共投入13.7亿美元(折合人民币约93.69亿元),融资事件发生78起,接近此前5年的总和。据风投公司NFX统
13、计,目前己有550家生成式AI公司相继入局,共筹集近140亿美元的资金互联网及传统A1大厂将从云服务、预训练模型提供等的基础层、中间层入手,创业公司则聚焦在下游的垂直应用。多数公司刚刚完成标准化产品输出,开始进入商业化探索的初级阶段:3 .2生成式AI发展现状在2023年过去的几个月里,算力基础设施看涨,各大公司抢滩大模型,类GPT商用化加速探索,整个产业链市场快速打开。据东吴证券预计,AIGC在内容生成中的渗透率将快速提升,应用规模迅疾扩增,预计2030年AIGC市场规模将超过万亿元人民币。3 郭美婷、蔡姝越:A1契约论A1GC产业链发展车驰船快,风险暗礁“涌现”,21世纪经济报道,4 5
14、汉能投资,生成式AI开辟人工智能新纪元,A1GC赛道风起云涌(上),p/22231519838222081.2. 1算力在AI大模型时代,AI领域的“军备竞赛”正从过去算法和数据层面的竞争,转变为底层算力的竞争。算力是大模型成本结构中最大的一块,GPU的性能,决定了这个新兴行业的步调。但是,GPU性能提升的速度,已经落后于大模型训练利推理需求的增长GPU是训练模型与加速推理的关键算力硬件。大模型拔高了对数据中心带宽、数据存储的门槛。云服务商会采购各类硬件,辅以冷却系统与运维服务,构建灵活、可扩展的IaaS平台,按需为客户提供算力。据介绍,大约每隔4个月,A1计算需求就会翻倍。广发证券分析师测算
15、,随着国内生成对话式AI产品加速推广,在乐观假设下,国内AI大模型在训练与推理阶段或产生相当于11万台至3.8万台高端AI服务器的算力需求。以英伟达单片A1OOGPU产品售价10万元、AI加速卡价值量占服务器整机约70%计算,则对应126亿元至434亿元增量AI服务器市场规模1.2.2大模型大模型已经成为本轮生成式AI竞赛的杀手铜。各个科技公司加码大模型,上演“百模大战”。中国人工智能大模型地图研究报告显示,截至今年5月28日,中国10亿参数规模以上的大模型已发布79个。而美国和中国就占全球已发布大模型总量的80%以上)谷歌基于Pa1M2推出聊天机器人巴德(Bard),据介绍Bard支持40多种语言,同时还拥有图像分析功能;微软日前宣布将GPT-4导入全新Bing搜索引擎和MicrosoFt365Copi1ot,亚马逊也通过发布泰坦(Titan)以宣布加入战局。中国大模型不断涌现,既有实力雄厚的互联网平台企业:百度、阿里、华为等互联网公司发布“文心一言”、“通义千问”及华为盘古大模型等