《美兰德公司探索如何利用AI+模拟仿真+兵棋推演应对大国博弈新挑战.docx》由会员分享,可在线阅读,更多相关《美兰德公司探索如何利用AI+模拟仿真+兵棋推演应对大国博弈新挑战.docx(19页珍藏版)》请在第一文库网上搜索。
1、美兰德公司探索如何利用“AI+模拟仿真+兵棋推演”应对大国博弈新挑战目录1 .简介12 .人工智能与国防兵棋推演22.1.概述22.2.复杂性的不匹配22.3.兵棋推演与人工智能之间的错位32.4.“做大”的吸引力43 .计算机兵棋的定义,计算机兵棋与仿真的区别41. 1.特点、用途不同43. 2.裁决方式不同54 .模拟仿真、兵棋推演的区别与联系55 .作战仿真与兵棋推演65. 1.概述66. 2.美军作战模拟的发展历史77. 3.我军作战模拟发展历史88. 4.作战仿真的科学原理89. 5.手工兵棋与计算机兵棋1110. 6.作战仿真与兵棋推演126 .大国之间复杂博弈带来认知复杂性157
2、 .各类新兴技术给建模问题带来机遇168 .“AH模拟仿真+兵棋推演”新模型179 .将A1整合到军事能力中所面临的挑战1710 .结论191 .简介大国之间的复杂博弈使得当代战争复杂性急剧增加。在此背景下,2023年2月,美兰德公司发布模拟仿真和兵棋推演中的人工智能报告,讨论了人工智能(A1)如何应用于政治、军事的模拟仿真和兵棋推演中;提出了三个主要观点:模拟仿真和兵棋推演是相互关联的研究方法,应该一起使用;A1可以对每一种方法做出贡献;用于兵棋推演的A1应该由模拟仿真提供信息,而用于模拟仿真的A1应该由兵棋推演提供信息。2 .人工智能与国防兵棋推演2.1. 概述国防领域展望未来战争时,新型
3、的人工智能已经成为融入军事作战能力中的最重要技术之一。美国国家安全人工智能委员会表示,与人类相比机器能够更有效、更快速地进行观察,作出决策并采取行动,无论在哪个领域这都是一种能够改变世界的竞争性优势。无数私营行业己经被这项技术颠覆,而且许多专家认为人工智能会对国家安全产生类似的变革性影响。兵棋推演,作为主要的行动方案探索和评估工具,在帮助国防领域试验整个国防活动频谱内整合人工智能能力方面,将发挥至关重要的作用。但是目前很少有兵棋能够有效将人工智能整合到其想定和推演中。出现这种情况的原因不是国防领域兵棋设计师因反对技术革新而全力捍卫兵棋推演最后的堡垒,而是国防领域兵棋和推演人工智能/机器学习系统
4、的设计理念没有达到统一,造成了成本、开发时间和设计灵活性方面的差异。为克服这些困难,本文认为国防领域兵棋设计师和人工智能开发师应该借鉴软件工程领域已有的最佳实践经验,并将重点从构建大型、单一且完全替代人类参与者的人工智能,转化为开发启用人工智能的小型、多模块部件来增强人类小组的能力。2.2.复杂性的不匹配兵棋推演在国防领域行动方案分析和作战概念开发层面发挥着重要作用。兵棋通常充当评估新技术对作战影响的试验平台。因此兵棋必须以足够的保真度来体现人工智能/机器学习系统,才能让对阵员了解其优势和不足。而兵棋保真度的提高通常伴随着复杂性的相应提升。在这种情况下,对阵员-通常在推演过程中仍然需要学习,可
5、能被无数抉择和决策弄得焦头烂额。这反过来会给对阵员增加压力,导致他们无法通过兵棋推演得出有用见解。人工智能/机器学习系统作为新技术,在兵棋中进行简化进而表征是一项棘手的任务。我们无法依靠历史战斗结果数据得出战斗表现经验法则。据我们所知,目前还没有统一的建模和仿真平台能够在战斗模拟中检验真实的人工智能系统。同时也没有类似的能够用来评估战斗表现的系统。如果没有这类数据,兵棋设计师将冒风险相信行业表面的承诺,这反过来可能导致对阵员的见解无法与现实表现保持一致(研究发现,美国国防部兵棋推演过度从积极方面表现新型传感器的能力,造成了未来战斗系统项目最终以失败告终)。因此,我们认为人工智能项目应该收集并分
6、享这类必要数据。但是,就当前的企业软件开发框架而言,在整个系统完成设计、培训和调整,直到整个采购周期接近尾声前,我们无法获得有关人工智能/及其学习系统的适用数据。2.3.兵棋推演与人工智能之间的错位由于设计理念上的分歧,将人工智能/机器学习算法整合到兵棋推演中也存在类似的问题。兵棋旨在通过为对阵员提供战斗模拟环境,模拟人类战斗决策过程来实现评估或者研究目的。就像彼得波拉在兵棋推演的艺术一书中提到的,当人类对阵员制定决策并必须应对决策后果时,兵棋能够发挥最佳作用。与其他分析工具相比,兵棋推演的优势是能够通过对阵员体现人类决策过程。另一方面,人工智能/机器学习试图用数字参与者代替人类参与者,或在某
7、些情况下提供相当于国际象棋引擎的兵棋推演引擎。例如深蓝、A1PhaG。和AIPhaStar项目均专注于击败大师级人类选手。确实,这类人工智能/机器学习突破了计算机决策的界限,但是开发这类系统需要大量时间和成本,存在让兵棋推演偏离主要关注点的风险。尽管替代人类参与者的高性能人工智能可能给蓝方对阵员带来挑战,但是深度神经网络或其他常见的人工智能算法的黑匣子特性,可能不利于分析师或者对阵员理解并学习人工智能决策。同样,很少有数字助手能够提供有趣的决策空间。就像一位同仁指出的,情况通常转化为“是否要使用人工智能。如果对阵员不选择使用,那么人工智能不会对对阵员的决策空间产生任何影响。如果对阵员选择使用人
8、工智能,那么决策任务被转嫁到计算机身上,这首先降低了兵棋推演对对阵员的需求。成本和灵活性方面的错位也同样值得关注。一般而言,国防领域的兵棋或者非常灵活-允许在兵棋中和/或迭代之间进行增量更改,或者是一次性的。而人工智能/机器学习算法也需要足够灵活能够适应兵棋规则和推演目标的变化,或者需要足够便宜以便只使用一次。但是当前的人工智能/机器算法开发无法满足上述任何需求。人工智能/机器学习系统在设计之初就假定其培训数据具有代表性。对于替代人类参与者的人工智能,这意味着规则的任何改变都必须体现在种子数据中,否则人工智能/机器学习的性能将受到影响。当然,美国国防部的一些Tit1e1O兵棋的成本也非常高。但
9、这主要源自让几十名对阵员和参谋聚集在一个地方数周或更长时间。而在预算有限的情况下,一款仅设计就需要花费数千万美元的兵棋可能会被扼杀在萌芽中。有人可能建议开发能够支持任何兵棋推演的人工智能,并由美国国防部承担前期开发成本。然后根据需求调整超参数并将成本分散到多年的兵棋推演中。即使“万能”人工智能系统在技术上可行,作为国防项目,这种算法的开发可能需要数十年时间。鉴于美国国防部对兵棋推演兴趣的起伏不定以及技术进步的飞速发展,这种方法待开发完成时可能已经过时或者变得无关紧要。2. 4.“做大”的吸引力“做大”当然不是人工智能所特有的。在20世纪70年代和80年代期间,商业兵棋越来越复杂,以至于达到无法
10、推演的程度(例如当时的“北非战役”兵棋)。这些产品需要大量开发时间而且发行成本非常高。最终这类兵棋降级为专门兵棋,而剩余的市场转向设计更简单的兵根。而在20世纪80年代、90年代以及21世纪初期,美国国防部见证了大型兵棋推演的发展,这类推演涉及数百名对阵员、多种模式和多个推演级别,以及多个期望结果列表。而其中最臭名昭著的是“千禧年挑战2002”兵棋推演。据报道,“千禧年挑战”研发耗费2年时间,耗资美国国防部2.5亿美元。它包括桌面兵棋、实时部队演习以及建模和仿真。“千禧年挑战”旨在为美国国防部的新型作战概念提供确定性检验环境。但是,“千禧年挑战”的巨大规模意味着在任何既定步骤中只能得出一些结果
11、,否则整个演练将可能被取消。当红方单位在兵棋推演的公开回合中先发制人击沉大部分美国海军军队,其影响实际上被忽略,因为这会干扰计划中的实弹演练。要做到面面俱到,兵棋设计师就无法兼顾必要的灵活性以适应人类决策,因此无法为兵棋的主要目标提供依据。近期,美国国防部的兵棋人员和赞助人已经远离1亿美元的巨型兵棋。他们现在选择专注于实现一两个目标的小型兵棋。例如,美国海军战争学院的“海上战争”采取模块化设计形式,因此在使用(或不使用)某些规则的情况下也能够实施推演。这便于裁判将兵棋的复杂程度与对阵员的熟练程度匹配到一起。从这方面讲,兵棋推演界似乎正在向多模块、目标导向型设计方向发展。3.计算机兵棋的定义,计
12、算机兵棋与仿真的区别现代兵棋自1811年诞生,已经历了200多年的演化。如今国内大热的计算机兵棋依托互联网的优势,为广大兵棋爱好者们提供了一个推演交流的平台,同时推动了国防教育的普及,培养了大批军事爱好者。然而时常有将计算机兵棋与计算机仿真混为一谈的观点,甚至认为兵棋是技术的倒退,现就二者之间的区别简单谈一谈个人观点。3. 1.特点、用途不同兵棋作为一种模拟训练和研究作战问题的工具,主要用于重现军事历史或者对即将发生的战争态势进行预测,着重探讨敌我作战思想、战术战法等以人为主导的认知因素。计算机兵棋乃是依托新时代计算机技术,以手工兵棋推演模式为基础所构建的系统,核心内涵与传统手工兵棋无二,皆在
13、于研究分析战争过程与结果,进而拟制出较为完善的作战方案。兵棋计算机化后,仅需一台普通的笔记本电脑就可以实施推演,不受天气、地形、场所等影响,随时随地都可以实施,便于院校教学和部队训练。因其操作简单,指挥人员可花费较少的时间熟悉推演,将更多的时间用于谋划作战;既可一人推演,也可多人多要素推演;既可在一台计算机上推演,也可在多台计算机多个地点推演;既可用于教学也可兼顾演习。计算机仿真的模型细节更加精细,更加强调模拟的准确性和客观性,通常规模庞大、设计复杂,用以模拟多层级、全要素、多科目的演练。在方案论证和武器平台验证等方面有其严谨的独到之处。重在客观反映出力量运用结果和装备性能优劣。3. 2.裁决
14、方式不同兵棋推演是认知领域的战争,是对战争全要素的宏观抽象和模仿,重点突出,简便易行,力求化繁为简。其回合制的裁决方式看似是离散时间,核心其是将推动战争走势的事件时间点进行了整合,虽与实战有一定差距,但对指挥官的大局观有着较高的要求,固而如美国的海军战争学院兵棋系用兵棋来训练指挥官的分析、决策能力。其次,兵棋的裁决方式是对影响战争行动及结果的主要因素提炼后进行模拟,并用概率进行综合和抽象,依据交战关系、历史经验和统计分析结果建立相应的裁决表,通过随机数的方法进行裁决。体现了战争的不确定性和偶然性,既能模拟出“背水一战”的险棋也能模拟出“步步为营”的稳步战术。相比之下,其他的计算机模拟仿真在裁决
15、时间上既可用连续性方式,也可选用离散方式,可根据需要灵活设置。但是在裁决方式上相对固化,在综合考量次要因素和难以量化的因素后常用一个固定概率来计算可能的行动结果,因而推演结果在可预知的范围内变化。综上所述,兵棋研究的重点是人员决策和兵棋事件之间的因果关系,强调以人为中心是兵棋区别于其他建模与仿真类型的标志,兵棋推演充分利用了人的决策控制和规划能力,突出人对战争问题的分析、设计和控制。即计算机兵棋注重人的主观性,计算机仿真倾向于客观力量的比较。4.模拟仿真、兵棋推演的区别与联系模拟仿真、兵棋推演有不同的优点和缺点。模拟仿真重在“定量”,但由于未能反映人的定性考虑而受到极大限制。有的批评者认为模拟
16、仿真的“严谨”所产生的结果虽然是精确的,但却可能是错误的,而兵棋推演则可以纠正这些缺点。兵棋推演处于同样受争议的境地。一方面,兵棋推演的各方面成就使得模拟仿真受益匪浅;另一方面,兵棋推演的质量参差不齐,有的纯粹是浪费时间,有的是与事实完全相反的结果,有的则能提供独到、丰富的见解。该报告认为,应该综合运用两种方法。如图1所示,随着时间的推移,从模拟仿真和兵棋推演中获得的经验被吸收借鉴,使用人工智能从模拟仿真实验中挖掘数据(第4项),以便为后续的过程补充完善理论和数据(第5项)。在任何时候,根据问题定制的“模拟仿真兵棋推演”模型都可以解决现实世界的问题(第7项)。如同在浅灰色的气泡中,人类团队的决策辅助工具(项目6a)和主体(Agent)的启发式规则(项目6b)被生