- 中国语音学报(第11辑)
- 中国社会科学院语言研究所主办
- 1072字
- 2025-03-31 07:31:26
4.程序运行
在setting.ini文件中设置好各项参数之后,双击xSegmenter.exe即可运行,但建议在Dos命令行窗口中执行此程序,以便于观察程序的运行情况,了解程序运行出错的各类提示信息。在执行xSegmenter.exe过程中,系统会自动创建以下三个临时文件夹:
TEMP文件夹:用于存放训练过程中所产生的一些临时文件,不用时可以删除。程序会根据这些临时文件来自动确定其相应的运行步骤,跳过已经执行完的步骤,以提高运行效率。如果全部删除了该文件夹中的内容,下次再运行xSegmenter.exe程序时,便会从第一步开始重新运行。所以在完成切分与标注任务之前,最好不要删改该文件夹中的任何内容。但在开始一个新的音段切分任务的时候,应注意检查是否存在TEMP文件夹,如果存在应事先予以删除。
HMM文件夹:用于存放最终生成的单音素声学模型文件及其相关的数据资源文件,包括音素列表文件和发音词典文件,不用时可以删除。如果HMM文件夹中已经存放了这三个文件,程序在运行时则会自动跳过声学模型训练的中间过程,直接调用这几个文件数据进行音段强制对齐与标注操作。所以在训练得到这几个声学模型文件之后,可将其保存起来,以便于后期直接调用,用于同类语料的切分与标注操作。
DATA文件夹:用于拷贝存放用户的声音文件及其相关的频谱参数文件,不用时可以完全删除,删除操作不会影响到用户的原始数据。该文件夹中存放的频谱参数文件,扩展名为*.plp或*.mfc,声音文件的扩展名为*.raw。用户在对同一语音语料库重新进行操作时,如出错后重新运行,则无须事先删除DATA文件夹内的数据文件,以免再次运行时又耗费时间去重新生成raw格式的声音文件及其相应的频谱参数文件。
一般而言,在程序执行过程之中,仅需要用户干预的地方是检查segment*.dict文件中的词条内容,该文件由程序根据用户提供的发音文本和发音词典自动生成。如果程序发现未登录词,则会在某个阶段暂停程序的执行过程,提醒用户去检查和修改segment*.dict文件中被标记为“unk”的发音条目,并等待用户的按键操作。如果用户给定的发音词典包含了全部发音文本中的所有词条及其读音形式,则通常不会出现此提示信息。用户修改完segment*.dict文件之后,按“y”键即可继续运行程序。当程序运行全部结束之后,用户在各个声音文件的原始路径下即可看到相应的语音标注文件,其扩展名为*.TextGrid。
据测试,如果用户提供的三类数据文件均无内容和格式上的问题,程序在执行过程中一般就不会出现什么问题。容易导致程序出错的原因主要有两个方面:一是发音词典文件,例如出现了未登录词,或者出现了词条格式问题、编码问题等。二是声音文件太少或者声音质量太差,导致某个或某些音素的声学模型建立不起来。也就是说,如果程序运行出错了,可以先从这两个方面去找原因,并核查相应数据。