Skip to content

Latest commit

 

History

History
22 lines (13 loc) · 950 Bytes

punctuation.md

File metadata and controls

22 lines (13 loc) · 950 Bytes

前言

在语音识别中,模型输出的结果只是单纯的文本结果,并没有根据语法添加标点符号,本教程就是针对这种情况,在语音识别文本中根据语法情况加入标点符号,使得语音识别系统能够输出在标点符号的最终结果。

使用

使用主要分为三4步:

  1. 首先是下载模型 ,并解压到models/目录下,注意这个模型只支持中文。

  2. 需要使用PaddleNLP工具,所以需要提前安装PaddleNLP,安装命令如下:

python -m pip install paddlenlp -i https://mirrors.aliyun.com/pypi/simple/
  1. 在使用时,将use_pun参数设置为True,输出的结果就自动加上了标点符号,如下。
消耗时间:101, 识别结果: 近几年,不但我用输给女儿压岁,也劝说亲朋,不要给女儿压岁钱,而改送压岁书。, 得分: 94