深挖ChatGPT原理.docx

上传人:lao****ou 文档编号:295021 上传时间:2023-07-30 格式:DOCX 页数:12 大小:66.14KB
下载 相关 举报
深挖ChatGPT原理.docx_第1页
第1页 / 共12页
深挖ChatGPT原理.docx_第2页
第2页 / 共12页
深挖ChatGPT原理.docx_第3页
第3页 / 共12页
深挖ChatGPT原理.docx_第4页
第4页 / 共12页
深挖ChatGPT原理.docx_第5页
第5页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《深挖ChatGPT原理.docx》由会员分享,可在线阅读,更多相关《深挖ChatGPT原理.docx(12页珍藏版)》请在第一文库网上搜索。

1、深挖ChatGPT原理最近,很多非常聪明、精通技术的人都在讨论ChatGPT,但我感觉他们都没有说到点上,他们对这款机器人的核心组件以及各个部分如何协同工作,并没有透彻理解。需要说明的是,我并不是说自己了解ChatGPT的一切。我和其他人一样,包括活跃的机器学习研究人员,仍在学习和思考中。我希望通过本文说明一下自己的理解,帮助其他“落伍”的人。1机器学习:基础知识ChatGPT的核心是生成式机器学习模型家族的大型语言模型。这个系列还包括Stab1eDiffusion以及所有其他提示驱动的文本模型,现在每天新闻讨论的都是这些模型。简单来说,生成式模型是一种函数,它可以将结构化的符号集合作为输入,

2、并生成相关的结构化符号集合作为输出。下面是结构化符号集合的一些示例: 单词中的字母 句子中的单词 图像中的像素 视频中的帧将一个符号集合转换为另一个相关符号集合的方法有很多种,这些方法并不限于计算机程序。你可以编写一个使用规则和查找表的计算机程序,就像60年代的聊天机器人。2 .概念介绍:确定性与随机性在讨论关系之前,我们先来介绍两个概念,它们将在本文中反复出现:确定性:确定的过程指的是,在输入既定的情况下,必然能得到相同的输出。随机性:随机过程指的是,在输入既定的情况下,得到的输出有一定随机性,即有时得出这样的输出,有时则会得出其他输出。例如,糖果机就是确定性的,投入一块钱,转动手柄,每次都

3、能拿到一块糖。也就是说,一块钱二一块糖,永远不变。但从另一个角度来看,糖果机也是随机的,投入一块钱,转动手柄,每次都能拿到一块糖,但这块糖的颜色基本上是随机的,且每种颜色的概率取决于机器内部不同颜色的比例。五台不同的糖果机,五种不同的颜色比例,就会有五种不同的颜色输出概率分布。暂时抛开这些关键概念,下面我们来说一说为什么关系很难。3 .关系很重要符号集合可以按照不同的方式关联在一起,关系越抽象越微妙,我们就需要投入越多技术来解决需要捕捉这种关系的问题。1 .假设我们将集合cat与at-cay)关联在一起,这是一个标准的“猪拉丁”转换(Pig1atin,一种英语语言游戏,形式是在英语上加上一点规

4、则使发音改变,小孩子经常通过这种游戏秘密交流),我可以用一个简单的手写规则集来管理这种关系。2 .假设我们将集合cat与dog关联在一起,那么这两个集合可以在多个抽象级别上关联。 作为有序的符号集合(序列),二者都有三个符号。 作为三个符号的序列,二者都是单词。 作为单词,二者都指代生物有机体。 作为有机体,二者都是哺乳动物。 作为哺乳动物,二者都是家养宠物。 等等。3.假设我们将集合thecatisa1ive)与thecatisdead)关联在一起,那么就可以使用更多、甚至更高阶的概念来比较和对比这两个符号序列。所有与猫相关的概念都可以考虑,所有“活着”与“死”相关的概念也在考虑范围内。在另

5、一个层面上,许多读者会发现我们可以称之为对薛定谤猫的互文引用。4.我们再添加一种关系,thecatisimmature与thecatismature。那么此处,我们讨论的是身体发育阶段还是情感发展状态?因为它是一只猫,“immature(不成熟)的意思就是“年轻”、“孩子”等。如果句子的主语是人,那么这个句子更有可能讨论的是适龄行为的一些情感概念。在阅读上述内容时,你可以想象,随着列表项从1到4,符号之间的可能关系会出现爆炸式增长。随着可能关系数量的增加,关系本身的抽象性、复杂性和微妙性方面也在加剧。上述,不同的关系采用不同类别的符号存储和检索(从纸笔到数据中心),以有用的方式捕获和编码。对于

6、第1个关系,我们只需在一张纸上画出简单地“猪拉丁”关系,任何人看了这张图,就可以将英语单词转换为“猪拉丁”。但是到第4个例子的时候,我们就会思考一个问题:为什么机器学习会需要价值几千万美元的资源?1 .我们发现这两个集合之间可能存在的关系就像一个小宇宙。这是一个令人眼花缭乱、紧密相连的概念网络,从简单的物理特征到生物分类学,再到身体和情感发展的微妙概念,一直沿着抽象阶梯向上延伸。2 .一些更抽象的可能关系出现的可能性更大。因此,我们就需要考虑概率元素。 正如我在例子中所说,如果我谈论的是一只猫,那么成熟和不成熟更有可能是与身体发育相关的一组概念,而不太可能围绕情感或智力发育。对于上述第2条中提

7、到的概念,“不太可能”并不意味着不可能,特别是如果我们拓宽背景。例如,我们添加一些额外的词: Regardingthecatinthehat:thecatismature.) Regardingthecatinthehat:thecatisimmature.突然间,所有的可能性都发生了变化。此处,成熟和不成熟代表的含义可能就是另一个领域。概括: 当符号集合之间的关系简单且确定时,你不需要太多存储或计算能力即可将一个集合与另一个集合关联起来。 当符号集合之间的关系复杂且随机时,将一个集合与另一个集合相关联,就需要投入更多的存储和计算能力,从而以更丰富、更复杂的方式关联这些集合。4.概念介绍:概率

8、分布高中的化学曾介绍过一个概念,有助于我们思考生成式AI:原子轨道。原子轨道指的是电子在原子核外空间出现机率较大的区域。不同能级的电子具有不同形状的轨道,这意味着它们可能会出现在不同的区域。下图是氢原子的轨道:(2,0,0)(2,1,0)HydrogenWaveFunctionProbabi1itydcmityp1oc.(3,1,1)(2,1,1)(4,2,2)我们单独挑出一个来看看:(321)(W)(4.3,1)(43,2)(443)对于上图中的轨道,如果你用比电子更小的东西戳原子,区域越亮,你戳到电子的几率就越高。对于图片中的黑色区域,并不意味着找到电子的概率为零,只是说这个区域出现电子的

9、概率低到几乎为零。这些轨道是概率分布,它们具有特定的形状,上图中的轨道像四个花瓣,所以如果你观察这四个区域之一的一个点,则更有可能发现一个电子,而黑色区域则相反。以上就是你需要了解的量子化学知识,也是暂时你需要了解的所有背景知识。下面,我们来谈一谈ChatGPTo5.ChatGPT不了解任何真相,也没有任何观点你可以想象,对于ChatGPT这样的模型,模型可能生成的每个可能文本块(从几个乱七八糟的单词到整篇连贯的文章)都是概率分布中的一个点,就像以上我们讨论的氢原子轨道中电子的分布位置。当你在ChatGPT的输入框输入一组单词时,例如:“Te11meaboutthestateofacatina

10、boxwithaf1askofpoisonandabitofradioactiveInateria1,你可以把点击“提交按钮的动作想象成进行一次观察,这会引发波函数坍缩,并得出一个符号集合(只是许多可能的集合的一个)。有些读者可能会意识到,文本到文本的大型语言模型,实际上是在概率空间中找到一个单词,并将它们串在一起形成句子。不过,在这个抽象层次上,“潜在空间指的是模型可能输出的所有单词的多维空间”与“潜在空间指的是可能输出的所有单词序列的多维空间”之间有一定的区别。为了方便读者理解,并最大程度地降低复杂性,此处我们采用后一个定义。有时,文本提示输入会将你带到概率分布中的一个点,其对应的集合为T

11、hecatisa1ive),而有的时候,你会到达不同的点,比如对应于Thecatisdeado请注意,上述输入符号也有可能会将你带到模型的潜在空间中的一个点,其对应的集合为phng1uimg1w,nafhCthu1huR,Iyehwgah,nag1fhtagn,尽管这种可能性几乎为零。这一切都取决于文本输入戳中的概率分布的形状,以及计算机的随机数生成器。重点在于,在这个例子中,我们经常说语言模型“知道”猫的状态(生或者死),但其实这并不重要。模型内部是否对猫有一定的了解,以及对其环境有不同的掌握,这些其实也是次要的。更好的方式是从这个角度理解:在模型可能产生的所有符号集合的空间中(从胡言乱语的

12、集合到莎士比亚的文集),模型概率分布中某些区域包含的符号集合,我们人类理解为thecatisa1ive。在同一个概率空间中还有一些相邻区域包含的符号集合,我们人类理解为Thecatisdeado以下是我们可能会在ChatGPT的潜在空间中遇到的一些与猫相关的符号集合,即可能的输出空间: Thecatrousedherse1ffroms1umberandb1inkedhereyes. Thesoftbreathingofthes1eepingcatgreetedSchrodingerasheopenedthebox. Jamon,decathimdead. Iveki11edmyfavorite

13、cat!,screamedSchrddingerashepu11edhispet,s1ife1esscorpsefromthebox.) Patcheswatchedthescenefromabove,hisastra1catformf1oatingnearthecei1ingashismaster1iftedhis1ife1essbodyfromtheboxandwept.)当你用不同的输入集合戳模型时,遇到有些输出集合的概率可能更高,但理论上所有输出集合都有可能遇到。因此,虽然你和我都围绕某个事实与ChatGPT进行交互时,例如,孟加拉虎是否濒临灭绝,我们不应该认为ChatGPT是拥有一些

14、个人经历的实体,或者认为ChatGPT掌握了一些关于孟加拉虎的事实,即便它告诉你和我两个人的信息有一些矛盾,也不能认为它对其中一个人撒谎。相反,我们应该认为,通过我的文本提示,我观察到了概率分布中的一个点,这个概率分布对应于关于孟加拉虎的一组事实和概念,而你也做了相同的事情。我们两个得到了不同的单词序列,而且这些单词序列似乎代表不同的事实,例如它告诉我这种老虎濒临灭绝,但告诉你这种老虎非常普通,这是因为我们两个戳中了概率分布中不同的波瓣,并在不同波瓣中找到了不同的点。我戳中的概率分布中波瓣包含的单词序列,按照人类的理解,意思是孟加拉虎濒临灭绝。你戳中的概率分布中波瓣包含的单词序列,按照人类的理

15、解,意思是孟加拉虎数量过剩。那么,我们应该如何解决这个问题呢?考虑到实际情况是,孟加拉虎确实濒临灭绝,我们需要去掉概率分布中你戳中的那个波瓣(即孟加拉虎数量过剩),或者至少降低这个概率。6.幻觉:特性还是错误?当大型语言模型输出的单词序列不符合现实真相时,我们说该模型是产生了“幻觉”。目前,我们有一套方法可以帮助我们塑造大型语言模型输出的概率分布,也就是说让一些区域变得更小或密度更低,而一些区域变得更大或更密集:1 .训练2 .微调3 .带有人类反馈的强化学习(R1HF)我们可以在高质量的数据上训练一个基础模型。所谓的高质量数据指的是符号集合,我们作为人类观察者认为这些数据有意义,而且是符合世界真相的符号集合。通过这种方式,经过训练的模型就像一个原子,其轨道的形状也符合我们的认知。接下来,我们尝试一下这个模型,找出我们不希望在观察过程中在输出空间中遇到的区域,然后我们使用更有针对性、精心设计的训练数据对模型进行微调。这种微调会缩小一部分波瓣,并扩大一部分波瓣,同时我们希望在多次微调波瓣的形状之后,这个波函数一次又一次的缩小能够得到更加令我们满意的输出。最后,我们利用带有人类反馈的强化学习,引入一些人为因素来帮助我们调整模型概率空

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 汇报材料

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服