26万字史上最强人工智能纪要 202304.docx

资源描述

《26万字史上最强人工智能纪要 202304.docx》由会员分享，可在线阅读，更多相关《26万字史上最强人工智能纪要 202304.docx（22页珍藏版）》请在第一文库网上搜索。

1、全中国最懂人工智能的公司之一（商汤，静默期结束，4月10号发布大模型），1个半小时，近3万字实录，解答你所有关于人工智能的困惑。由最具话语权的人解答真实的A1行业是怎么样的，颠覆掉A股很多认知。关于光模块的幻想、关于国产芯片的能力，训练用的谁的芯片，各大公司有多少算力，国内大模型和ChatGPT的对比，答案都在里面一定是先要有一个通用的基模型，必须是全修的，各种各样的数据它都见过，有了一个比较全修的这样一个通用的防地去磨好之后，你再用垂直领域的数据再去做一个垂直领域的模型，这样你垂直领域的这个模型的效果它才会足够的好。算力还是关键中的关键，大模型参数不代表好坏，文心2600亿参数效果不如175

2、0亿的ChatGPT3.5,主要是训练的不够，打磨的不够。训练100次千亿参数模型，可能能解决这些问题。感慨一句，A股炒算力的标的都是非常远期的，兵正能马上、立刻提供算力的还是商汤，训练也是商汤给做的。单任务并行使用IoOO张AIOO以上不是容易的事情，在训练用的还是英伟达的AIOO芯片。在短期内国产芯片并不能胜任大模型训练任务，做做小模型可以，新一代芯片可能可以胜任推理。包括很多应用，一句话，没有谁可以高枕无忧。第三次流量分配到来，未来并不是一马平川。大模型：4月10日发布，画图功能超过MidjOUrneyV4接近V5之前没有披露大模型是因为处于杳港的静默期（意味着后续的交流会增加），4月1

3、0号，商汤会发布自己的大模型（之前就已经训练好了，因为静默期一直不能披露），努力追赶GPT4,对于垂直用户，必须有一个通用型大模型作为基础训练的垂直大模型效果才会好。垂直应用面临巨大洗牌，但是洗牌的基础是你得有一个底层好的大模型。商汤希望成为这样的持续迭代的底层大模型。GPT4是8个月之前训练好的（在微软投资之前），只用了1万张VIo0,400号人。GPT4是目前世界上唯一一个模型，可以去打败90%大学生的比例，而且是通修的大学生，其他模型连高中都考不上。国内这方面落后了，很多岗位的就业最基础要求是大学生。但是手里有1万张GPU很快就能考上大学了。商汤是最早把人工智能大模型写入招股说明书的公司

4、，2023年就有相关的研究。但是大部分人不知道怎么实现大模型，目前行业知道了，只需要基于大量数据去训练，可以产生涌现，这是一个重大发现。目前商汤的模型也出现了涌现（涌现不局限在语言，图片等领域也一致）。商汤的大语言模型，不需要把中文翻译成英文做训练，再翻译回来。是原生的训练。作图能力超过到midjourney第四代版本的能力，接近第五代的能力。将发布虚拟人生产数字平台，能够直播卖货、生成视频等等，中标四大行的数字平台。参数量不是号称越多越好，需要解决很多问题，很多参数都是凑的。怎么样达到比较好的效果。训练100次，千亿参数量就行。训100次你才能够把这里面所有的这些需要解决的问题，工程上的一

5、些点，优化上的一些点，所有的一些这个技术的这个边边角角的一些细节都能做好100次，中国和美国。流量重新分配，大家要知道这件事情可能每10年才会发生一次流量重新分配，第一次。第一次就是互联网出来泡沫之后。第二次就是移动互联网头条出来，流量分配今年开始第三次流量分配，你的互联网APP如果有很强的BGM能力，那用户就会用它用的越来越多，没有任何人在当下是可以高枕无忧的，所有的公司在当下都不能够高枕，巨头都不能，谷歌都不能告诉你大装置：国内主要大模型训练的来源商汤科技历史融资60亿美金，30亿投入了“大装置”（人工智能训练平台），训练出来的视觉大模型是全球第一的。公司是真正的A1DC,目前大装置一期

6、有5000个机柜,90%在使用，二期建完共有1万个机柜，总算力超过IOXfaIse,100P的一个算力。商汤A1oo充足，在停售前拥有1万张A1oO芯片。训练一个百亿参数量的视觉模型，对于算力的消耗是等同于训练一个千亿参数量的语言模型。为什么商汤对外开放“大装置”，训练模型需求是波动的，只训练自己的模型，成本和风险会非常高，后面还有4、5、6代模型要训练，投入越来越大，绑定更多的合作伙伴，成为平台本身“众筹”算力，获得长期长跑的能力临港大装置有2.7万张显卡，已经用了海光和寒武纪，并做了国产适配，商汤是寒武纪的第一大客户。坦白讲就是这一波的大模型训练，确实是目前只有A100和A800能够

7、真的跑得起来。目前国产GPU只能做小规模和中规模的训练和推理。商汤训练大模型已经5年了，调动上千张GPU卡，需要非常难的架构，商汤在这方面技术非常领先。目前可以做到7天不断点，OpenAi两三天就会断点一次，因此商汤准备输出训练能力。 A股的上市公司，大部分没有GPU,或者买不到A1OO和A800,算力来源基本上是商汤。拥有5年的单任务并行运算1000张卡的经验（还能对外输出，国内独家），能够用4000张A100卡跑出1万张的A1OO等效算力。目前有八个大客户在训练，还有n多家客户找过来要训练。大装置不仅是一个资金的一个投入的问题，卖给客户的是时间，可以让需要训大模型的客户在一个月之内数据

8、搬上来，一个月之内把你的千亿参数的模型去年跑通，然后再过一个月你就可以出结果。文字记录：PART1大模型常见问题联合创始人、执行同事徐冰先生来跟大家来做个交流，那下面我把时间交给徐斌先生，大家欢迎。这种现在看得出来大家都非常关注人工智能这个行业。我们前段时间一直处于静默期，因为这个港作为一家港股创始公司，这方面都有一些要求，所以我们一直以来没有对大家披露商汤的这个大模型，以及通用人工智能A1GC的一些研发进展。那么我们也是从上周开始业绩公告之后，然后才正式开始路演。给大家去做一场纥面的这个情况的一个更新，因多挣也可以看到就是说。这个大模型这件事情，实际上很多公司在历史上可能都是踩空的，因为它确

9、实是一个有极大的一个投入，并且历史的商业回报和商业变现模式都非常不清晰的这样一个状态。那么我知道我现在全球范围去看，就是说通用人工智能已经变成一个必然的趋势。然后在今年大家也经常听到一些说法，就是今年是通用人工智能的元年，我们这个在上周像Bi11e、mask等一批人开始去呼吁我们暂停一下这个通用人工智能技术的研发，然后担心的这个距离。4能力已经非常出众了，那如果持续迭代到GPT5、GPT6,那会不会出现一些失控的局面，对吧？就是那这件事情。我们也有很多的这些这个人来问我们一些问题，那确实我们自己也有一定的这个顾虑，确实是啊，就是因为在去年，去年截止去年是没有人会感觉有通用人工智能具体的实现路径

10、的。那么通用人工智能的定义就是说人工智能的能力强到它可以跟我们每个人去媲美，对吧？你怎么去定义就是人类的这个智能？但现在基本上GPT4达到的能力是说他已经可以媲美90%以上的这种优秀的大学生的能力了，而且他是一个通修全科的大学生。也就是他不仅仅是在去修某一个咱们修的专业，比如金融或者法律，他是全科所有的东西同时都修，然后他可以在各个领域里面去这个打败90%以上的大学生，甚至像法律这样的领域。我们可以想象有什么样的人可以去做律师？一般来说都是那些比较聪明并且比较努力的，经过10年甚至更长时间的一个这个培训，上学、上基地实习，你才能够quaIify来去做一个律师，通过这个律师资格考试。那现在呢？在

11、这样的一些就是评估人类智能能力的这些考试上面，其实GPT4的能力超过了90%的人，所以再往上继续去迭代。我们也知道就GPT4不是最近训练出来的。GPT4是8个月之前训练好的，也就是在openai拿到微软的这今年100亿美金的一个投资，对吧？在拿到他的这个新增的这个3-4万张的AWO的卡之前，openAI用了相对有限的私有不到20亿美金左右的一个凌冬再加上这个1万张V1O0。就是A100的上一个版本就是VIOO的这个计算卡，openai用了少量资源，400号人。然后能够把这批死这样的能力给做出来。我不知道咱们在座的各位有多少人用过GPT4,我身边已经有非常多的人在去用，天天用它就是他的能力，就是

12、说跟其他的模型是两个物种。GPT4是目前世界上唯个模型，可以去打败90%大学生的比例，而且是通修的大学生。其他的模型的话就通俗的来理解。其他的模型的话其实这个可能高中都考不上，就是他还是有一些这个实施的这个差别。那么就是说openAI用了相对有限的资源，然后在8个月前做出来这批次，并且用了这8个月时间做好这个Iines,对吧？能够让他的能力跟人类的目标去a1ign,尤其是跟这些，这个就是价值观正确的人的目标需要按，而不去跟那些邪恶的人的目标去来是吧？所以他用了8个月时间做好了版本才释放给公众去那工作时间之后，也是这个非常的惊讶，那么就是这也是刚刚发生半个月的事情，所以这件事情。其实是触发了大家

13、很多的这种讨论。就是我们进入了这样一个通用人工智能的时代，那这个时代到底意味着什么，对吧？对我们在座的每个人意味着什么？那其实这个可能我们去看整个律师行业，整个律师行业有可能很快速的发生大的变革,也就是现在整个律师行业，对吧？律所的业务没有扩大一倍，但是律师的工作能力扩大了2、到3倍。那这个结果是什么呢？这个供需不匹配，在需求不变的情况下，你可以产生两三倍更多的这样一个供给，就是法律意见，各种各样的协议。那这个就自然会引发这样的这个行业的一个变革。可能有大量的流失，就需要去转行了。在这样的一个就是竞争之下，所以有句话说，会用GPT4的人会用这些通用人工智能工具的人，会把那些不会用主工具的人给取

14、代掉。这里面行业和行业的竞争是非常。它不是影响了某一个和两个的。那上周有一个统计报告出来，整个欧洲加美国有3亿个工作岗位就是白领，3亿个工作岗位会被通用人工智能技术去影响，那这个影响实际上是非常大的这样一个影响，对吧？但对于中国来看的话，在我看来可能稍微的反应慢了半拍。我们整体国内现在的cash是属于落后的一个cash,没有任何一家公司截至目前能够拿得由来一个考上大学的通用人工智能的这个模型。忸为考不上大学的这条线是非常重要的一条线。因为我们很多很多的这个就是生产活动里面对于人的素质的要求，是大学生的要求，尤其是咱们正从事的这个白领彳亍业里，袤们行于元的素质要京是大学生是最。基础的这样一个要求

15、。那如果我们做出来的通用人工智能模型你是达不到大学生的标准的话，那它的这个应用性和实用性都还是相对比较有限的。所以现在就是说据我了解，我们几家手上有超过1万张的AE版的GPU很快这样，够考上大学的。所以我们本身就是说这周开始的实际上是一个业绩路演。但是我在上周在香港的这个四天的时间，我们大概见了不到30家机构，几乎没有人问我们业绩了。没有什么好业绩问题，大家讨论的问题就是都是你们有2万张的GPU卡，你们这么早就开始做foundationmodeI是吧？因为我们是把foundationmodeI就是就是人工智能大模型写到招股书里面来，在2023年年底上市的时候，就介绍商汤是如何做房地直播的，做大

16、模型，做通用的视觉能力，然后只能够是解决各行各业的，这个就是小模型生产的这样一个大批量生产的问题。但实际上在过往需要就是通用人工智能，基于超大模型能够实现这件事情是并不是一个公式。大部分人不知道怎么实现通用人工智能。但今年这件事情变成了一个共识，基于通用人工智能，基于这个foundationmode1,基于大量的数据去给foundationmode1去训练它，用超大功能的算力去训练它。那么最终你能够实现超大神经网络的能力的涌现，就涌现实际上是个关键词emergento大家去看这个方面的一些报告也提到了，就是这件事情是没有人能解释的，openAI自己的技术人员无法解释为什么会有涌现，所以它实际上就是说非常神奇是一个discovery,它是个明星。discovery对于一个现象就是超大规模的神经网络，就是这个artificia1neuraInetwork,他有能力去，他有这个做到一定规模

展开阅读全文