《机器同声传译系统基本要求与测试方法.docx》由会员分享,可在线阅读,更多相关《机器同声传译系统基本要求与测试方法.docx(3页珍藏版)》请在第一文库网上搜索。
1、机器同声传译系统基本要求与测试方法一、标准名称:机器同声传译系统基本要求与测试方法二、项目提出单位:上海市经济和信息化委员会三、起草单位:科大讯飞(上海)科技有限公司、中国外文局翻译院、上海市人工智能行业协会、北京外国语大学、上海外国语大学、鹏程实验室、上海交通大学、上海华东电信研究院、合肥智能语音创新发展有限公司、科大讯飞股份有限公司四、立项理由上海是中国经济的重要中心和国际交流的窗口,其经济活跃度和国际化水平都非常高,随着跨语言国际会议、文化传播和沟通交流越来越多,同传翻译需求与日俱增,但同时也面临着人工同传译员培养与工作成本高、知识存储与词汇量受限、无法匹配当前市场需求等问题。机器同声传
2、译涉及我国人工智能产业重大技术布局方向,具有客观信息的识别与记忆完整度高、术语与词汇库大、可低成本长时间高效工作等优势。利用机器同声传译辅助或部分场景代替人工翻译已成为一种趋势。尽管机器同声传译近年来发展迅速且取得了较好的应用落地成果,背景环境复杂多变、说话人表达方式多样且存在口语化和方言化现象、多语种语音和翻译训练数据稀缺、专业领域的覆盖度不够等问题,导致在不同的机器同声传译系统可用程度不一。此类系统尚未形成专门的技术以及系统功能指标的测试方法标准。因此,为了满足上海国际化交流的需求,为了确保机器同声传译系统的质量,亟需在上海市制定机器同声传译系统基本要求与测试方法地方标准。五、主要内容本文
3、件规定了机器同声传译系统的术语和定义、符号和缩略语、系统基本框架、基本要求和测试方法。系统基本框架包括服务端和应用端。应用端用于输入与输出信息的处理和显示,包括声学降噪模块、字幕显示模块、音频播放模块、视频播放模块;服务端用于对输入的源语言语音流进行语音识别、机器翻译和语音合成等处理,包括;语音识别模块、识别后处理模块、机器翻译模块、翻译后处理模块、语音合成模块、虚拟人模块。基本要求包括核心技术要求和系统功能要求。核心技术要求从源语言语音到目标语言文字、源语言语音到目标语言语音两个维度提出要求,源语言语音到目标语言文字的核心技术要求包括翻译效果、翻译实时性和翻译可读性;源语言语音到目标语言语音的核心技术要求包括翻译效果、翻译实时性和语音合成。系统功能要求从效果优化、内容管理、离线同传和内容安全四个维度提出要求,效果优化要求包括热词干预、领域模型定制和人机协同干预;内容管理要求包括会议导出。测试方法包括测试准备、测试环境以及测试方法。测试准备主要包括测试数据集、音频采样设备及回放设备的准备。测试环境包括被测系统、被测系统网络环境、测试场景要求和测试数据集。测试方法与基本要求中的条款一一对应,并给予具体的测试方法。六、适用范围本文件适用于机器同声传译系统的设计、开发、应用和维护,也可用于指导第三方测评机构对机器同声传译系统进行功能评估和系统验收。