数据标注：语音标注的8种常见方式

作者：free

2024年9月27日 11:45 星期五

字号：小中大

1、发音校对

发音校对是对整个口语训练过程中的数据采集以及对不标准的发音进行纠正的过程。

2、语音清洗

语音清洗是对语音进行重新的审查和校验的过程，清洗空音频，筛选出符合要求的音频，删除重复信息，纠正错误，并提供语音一致性，助力语音识别模型训练。

3、VAD语音切割

VAD语音切割，从一段语音数据中找到语音部分的起点和终止点，从中抽取语音情感识别所需的信号特征，从声音信号流里识别和消除长时间的静音期，将有效的语音信号和无用的语音信号或者噪音信号进行分离，以使后续的语音转写、语音情感分析。

4、韵律标注

韵律标注是指从语音数据中确定韵律信息，再对标注文本进行韵律符号标注，常见于语音合成技术。

5、音素标注

音素标注是根据音标、组成音素和读音对语音进行标注的过程。

6、情绪判定

情绪判断能够对语音内容中说话人的情绪倾向进行判断，区分他们的情感态度，帮助训练NLP模型。

7、声纹识别标注

声纹识别标注是将语音人声中的声纹特征提取出来，并标注上对应属性，以帮助训练语音识别模型。

8、ASR转写

ASR转写是根据音频播放的内容转写为对应的文本，并选择相关的标签，用于语音识别模型训练。第三方平台可对提供的语音数据进行精确转录，支持普通话、方言、英文和小语种等多种语言。

您阅读这篇文章共花了：

本文无需标签！

本文作者：free 文章标题：数据标注：语音标注的8种常见方式
本文地址：https://renchuanchuan.com/?post=40
版权声明：若无注明，本文皆为“RCC”原创，转载请保留文章出处。