智能Agent及多Agent在虚拟现实系统中的应用研究进展.docx

资源描述

《智能Agent及多Agent在虚拟现实系统中的应用研究进展.docx》由会员分享，可在线阅读，更多相关《智能Agent及多Agent在虚拟现实系统中的应用研究进展.docx（25页珍藏版）》请在第一文库网上搜索。

1、智能Agent及多Agent在虚拟现实系统中的应用研究进展人工智能读书报告董子龙10421038浙江大学CAD&CG实验室摘要：Agent在虚拟环境中的应用研究要紧是单一的对话表情功能，虚拟生物的交互运动与社会系统的内部结构。本文概括性地介绍智能Agent及多Agent在虚拟环境中的应用现状，根据系统的规模，由易到繁地说明当前研究的体系框架与实现。关键字：智能Agen3多Agent,虚拟环境，体系框架一弓I言Introduction随着计算机硬件的不断升级，用户对系统环境的要求越高。在系统环境上,用户希望在一个与现实世界相仿甚至难辨真假的平台上工作；在交互操纵上，用户希望系统提供更强大更全面的

2、辅助，习惯用户的操作。前者促进了虚拟环境技术的不断分化深入；后者常常引入人工智能领域的重要概念一一Agent,在面向过程，面向实体，面向对象编程的基础上进展出更抽象的面向Agent编程5。利用Agent技术建构的智能化实体，广泛应用在探测、材料、医疗、教育、游戏等领域，帮助或者代替人类完成工作7。1.1 一些工作SomeWorks虚拟环境涵义很宽，对现实世界中物理的方法、行为、地理与抽象的思维、情绪、感情的模拟都属于虚拟现实的范畴，因此Agent与之的结合点很多，在实际应用给开发人员很好的实现灵感。He1mutS1v一个卡通形象的动画(Animated)Agent，具有让人信服的表情与社交能力

3、，用于日本学生的英语对话训练。他们使用XM1风格的MPM1脚本语(Mu1ti-moda1presentationMarkup1angUage)操纵不参与交互的Agent角色的行为语言。Bak1i由俄勒冈州研究院、卡内基梅隆大学等联合开发的语言教学系统，是一个具有听觉与可视化演讲能力的Agen3结合了语音识别，面部动画，表情跟踪与语音朗读四个方向的技术。与A痴。的JaCOb4项目在虚拟现实系统中构建一个叫做JaCob的拟人(Human-1ike)Agent,传达给用户操作指示。Jacob项目涉及虚拟现实模型的软件工程、自然语言等交互模块与融合Agent技术，由于任务模块与指令模块的分离,Jaco

4、bAgent能够容易地移植到其它虚拟环境中。IPke与Yong在VIENA6项目中(Virtua1EnvironmentsandAgemS)使用习惯性Agent帮助用户设计与探索3D图形，这是一个多Agent系统，Agent之间根据当前状态互相协作实现用户的指令；而关于用户来说，只是面对一个能懂得与执行语言指令的AgenCy。Agent的研究还包含操纵脚本8910网与实际应用的性能分析111213o1.2 本文框架1ayoutofThisArtic1e本文从三个层次总结智能Agent与多Agent系统在虚拟环境中的应用。第3章介绍会话(COnVerSationa1)Agent,第4章介绍行为(

5、BehaViOraI)Agent,第四章关于多Agent。为了帮助读者形成完整的概念，第2章会对智能Agem做出探索性定义。二关于AgentConceptsofAgent智能Agent的定义很不统一，在不一致应用，从不一致的角度，研究人员总是在自己的懂得基础上给出说明。Stan与Art考察大量Agent的概念，得出模糊却内涵丰富的结论14：自主(AUtonOmOUS)Agent系统是环境的一部分，只在特定的(SiIUated)环境中感知环境并作用于环境，从而实现自身的日程，影响将来的感知。自主Agent与智能Agent应该是等价的。智能Agent总是与之对应的环境紧密结合，离开了所处的环境，A

6、gent就失去其存在的意义，再也不是Agent。她通过感应器(SenSor)感知环境，利用效应器(EffeCtOr)作用于环境。她具有自己的信念，即有目的，有意图地行为，使环境将来的状态符合日程。智能Agent能够是硬件，如机器人，人眼等，自然更是软件(SOftbot)。本文要紧讨论软件(SOftWare)Agem的设计框架与实现。对智能Agent概念的全面解释能够从WinikOff32等提出的SAC(Simp1ifiedAgentConcepts)“一个简化的模型，能让更多人开发智能Agent系统，但是储存BDI的能力与效率”一一中获得。2.1 描述性定义DescriptiveDefinit

7、ion描述性定义指出只要一个基于硬件或者软件的系统具有某些描述性特性，就能够被称之Agent。可分为弱定义与强定义15。弱定义包含自主性(AUtOnOmy),社会性(SoCiaIabiIity),反应性(ReaCtiViIy)等人类特有的性质。强定义在弱定义的基础上加入知识(KnoW1edge)、信念(Be1ief)、意图(Intention)责任(Ob1igation)等精神概念，有研究者称之情感(EmOtiOnaI)Agent170其它很多词汇也常被研究者用来描述Agen3如移动性(Mobi1ity),诚实(Veracity),善良(BeneVOIence),理性(RatiOnaIity)

8、,长寿性(1ongevity),前瞻性(Pro-active,Goa1-directed)等。2.2 形式化定义Forma1Definition本文的形式化定义只是以理想理性(IdeaIRationaI)Agent16为例，抛砖引玉,帮助读者对不一致类型的Agent形成自己的形式化方法。理想理性Agent：对每一个可能的感知序列(PerCePtsequence),她都能基于感知序列与内建的知识提供的证据采取行为，期望性能最优化。Agent由PAGE描述：感知(PerCept),行为(ACtion),目标(Goa1),环境(EnVironment)。Agent等于体系构架(ArChiteCtUr

9、e)与程序(Program)OStuart与Pefer提出最基本的骨架Agent程序：functionSKE1ETON-AGENT(percept)returnsactionstatic:memorytheagent,smemoryofthewor1dmemory-UPDATE-MEMORY(memory,percept)action-CHOc)SE-BEST-ACTIoN(memory)memory-UPDATE-MEMORY(memory,action)returnaction而根据程序设计的立足点不一致，由简到繁区分成：表格驱动(Tab1e-driven)Agent,简单反射(SimPI

10、eref1ex)Agent,跟踪内部状态的反射Agent(Ref1exagentwithinterna1state),基于目标的(GoaI-based)Agent,基于效能的(Uti1ity-based)Agent。三会话AgentConversationa1Agent会话Agent要紧在教育培训程序中扮演导师与同学的角色，随时随地供给交流学习的伙伴，增强娱乐性与参与性，极大提高教学效率，也能够在场馆中推广产品，或者说明旅游项目。MierOSoftOffiCe系列软件的帮助精灵是我们最熟悉的会话Agent。会话Agent具有通常的语言能力，也有一定的声音识别能力，甚至有感情；在虚拟环境中，她常

11、常通过图形具体化(Embodied)O本章将介绍BakIi与MaX两个系统，说明如何让Agem表示出表情与嘴形，或者手势，进一步加入情感。关于会话Agent的更多研究请参考222324253.1 表情与嘴形Facia1Expressionand1ips与一个表情丰富、语言流畅的伙伴交流，无疑是长期在计算机前学习生活的人很吸引的事。图3-1所示的Ba1di19曾在上文引述过,是一个由计算机驱动的聊天人头,暂时用于聋哑儿童的课堂语言教学。她的存在与功能完全依靠于计算机动画操纵，与文本一语言合成。她的语言有33个参数：颌旋转与挤压，嘴的水平宽度，嘴唇弯曲与突出操纵,下嘴唇褶皱，嘴唇垂直位置，牙齿的位

12、移，舌头的角度、宽度与长度。为了能在低端设备上实时绘制，研究者使用目标相似合成(TerminaIAna1ogueSyntheSiS)技术，仅令最终结果看起来很像，并没有完全模仿生理结构。大约900个多边形边边相连构成Bakii的眼睛、瞳孔、虹膜、巩膜、眉毛、鼻子、皮肤、嘴唇、舌头、牙齿、脖子。多边形的拓扑结构与动画由一个参数集操纵。Ba1di的研发进展要紧在操纵参数的增加与修改，舌头的两代实现方式，视觉语言合成操纵，文本一语言合成，双模(视觉/听觉)合成，与并行信息处理。最终大概有20000行C代码，可在SG1与PC上实时运行，图3-2是一些结果。图3-2Bakii的表情：高兴、生气、吃惊、恐

13、惧、伤心、恶心3.2 手势Gesture手势是人们自发的无意识的语言表达，是很重要的沟通手段，对多模式(MUIti-MOdaI)会话Agent的具体化最终都需要一套肢体语言的支持，可从真人捕捉，或者手动预定义。拟人AgentMax20是在3D虚拟环境中的装配专家，通过上肢活动与口述的相互协同向用户展示装配过程，图3-3。图3-3与Max多模交互MaX的多模(MU1ti-MOdaD发言直接由一种基于XM1的语言描述，包含语言词句与非语言行为。语句被时间点(TimePoint)分隔，特定的手势动作被定义在相应的时间间隔中。手势由发出阶段(StrokePhraSe)的时空特性决定，由子动作构成。子动

14、作被定义成：(1)拳头的位置，(2)手的形状，(3)拳头的朝向；每一项性质用数值或者符号表示。子动作是静态或者动态，静态代表一定时间内不变，动态子动作又由连续的动作片断(Segmem)构成。手势的特点，如并发(SimU1taneity),滞B(Posteriority),重复(RePetition)与对称(Symmetry),既能够显示说明，也能够用行为通信函数表达。图3-4是XM1说明片断，图3-5是其结果。Andnowtakethisbarandmakeitthisbig./specificationZbehaviorspeoOffi1iateOnset=33end=1147va1uetype=,s

展开阅读全文