《中文普通话标注规范2021.docx》由会员分享,可在线阅读,更多相关《中文普通话标注规范2021.docx(2页珍藏版)》请在第一文库网上搜索。
1、语音质检规范1.1. 有效性标注听所给的句子并判读朗读语句是否为有效,音频出现以下情况都标为无效。a)发音读错复/磕巴等时: 【餐饮地图句式】中读错部分为非固定搭配,修改后不影响句子原意且语句通顺的情况下,标记为有效,保留音频并通过修改文本的方式使音频与文本保持一致,如(找一找附近的沸腾鱼香读错成“找一下附近的沸腾鱼香,直接修改文本即可); 【餐饮地图句式】中读错部分为固定搭配,如地名/菜名媒系名/餐厅名/店名等,或读错后语句不通顺,语义表达不清或偏离原语义的情况下,不可修改文本,标记为【无效】; 【餐厅菜名核心词】和【地图导航核心词】都为专有名词,不可修改文本b)首尾切断导致语句录制不全,则
2、标为【无效】c)出现他人说话声等或噪声过大盖过录音人声音时,标为【无效】d)若录音人语句不通顺、不连贯,字与字之间停顿或拖音超过Is,该条视为无效。只有有效音频进行【录音切分】和【文本标注工无效音频废弃,不进行交付。无效原因:噪音:噪音过大导致不合格;专有名词读错:专有名词读错无法修改;回声:录音环境有回声,数据不合格;句意不通:读错,修改后句意不通;声音小:朗读声音过小,无法听清;切音:前后语句被切音,导致意思不完整;拖音:字与字之间间隔超过IS,导致不合格;发音错误:英文或者汉字读错(汉字读错无法修改,修改后句意不通)有方言口音也不合格(带口音的音频一定和普通话发音不一样)1.2. 录音切
3、分每条音频只截取朗读部分,无需预留静音段,不可以切到别人的说话。1.3. 转写标注对有效音频进行语音和文本一致性的校验,出现不一致时,符合要求的可以修改文本。1.3.1. 英文转写根据发音人对英文单词朗读方式的不同,对原文本进行修正。按英文单词发音读时使用小写字母转写,按单字母逐个读时使用大写字母进行转写,如文本dab,音频读的是daeb,则转写必须是dab;而读的是D/A/B,则转写必须为大写DAB,验收时若出现音频和转写文本不一致,算错误。13.1.1.符号和数字转写的读法除了英文或本国语言中不可省略的之外(如Idm),不应该有其他标点符号,如果发现其他非合规符号,删除即可。采集文本中有阿拉伯数字,在标注时,树蝴在音频中的!藉,螃为一-对曲鼓字,例如:1读为yi1时,转写为一;读为yao1时,转写为幺;2读为er4时,转写为二;读为Iiang3时,转写为两;3读为san1时,转写为三0转写为零如116读为幺幺六”,标注时需要将116修改为“幺幺六,保证音频和文本一致,若不一致,则算错误。打开那首s1eepthieves谙iii里的歌,特殊字符iii读了音三,就按汉字三转写,如果按字母读了三个i,就按大写字母转写成II1我想听一首symphonynoinEminoriv,如果实际读的时彳用Eno,读成了number,iv读成了英文four,那么就按照实际读的转写。