3款重磅神器实现音频转文字
无论是学生、上班族,有没有遇到过"语音转文字"的难题?例如开会的时候录制了一段音频,想要把它转化成文字。如果单独靠耳朵,人工转化,费时费力。在智能语音技术方面,科大讯飞有世界领先水平。由于技术难度较高,往往语音转文字的服务都是收费的,并且不便宜。实现上述功能的软件也有不少,但都没有讯飞的软件好用。今天给大家介绍一种"曲线救国"的方法,进行白嫖!
一、讯飞听见
讯飞听见网站是科大讯飞推出的以语音转文字为核心业务的平台。我们打开官网,可以看到有两部分:机器快转、人工精转。对于白嫖用户来说,智能用机器快转了,准确率最高能达到97.5%。
我们上传一段音频后,可以看到按钮"转写预览",点击后,稍等片刻,语音就自动转为文字了。但是对于免费用户,它只是提供了预览,有以下几个缺点:1、只能预览3分钟的转写;2、文字无法复制。为了解决这两个问题,就是今天要介绍的主要方法,请看下面的文章。
讯飞听见官网:https://www.iflyrec.com/zhuanwenzi.html
二、音频分割
对于超过3分钟的音频,我们可以使用软件将其分割成几段3分钟以内的音频。这样就突破了上文中的第一个缺点。打开音频分割软件WavePad Master后,将音频导入(依次点击:首页→打开),然后将光标(红色线)放到3分钟附近。然后依次点击:编辑→分割→在光标处分割。
然后会看到下图,音频被一分为二了。原123.mp3被分割成了123_0.mp3和123_1.mp3。其中123_0.mp3的时长不到3分钟。
如果123_1.mp3依旧超过3分钟,那么我们按照同样的方法可以对它进行再次分割。即123_1.mp3被分割成了123_1_0.mp3和123_1_1.mp3。因此,123_0.mp3、123_1_0.mp3和123_1_1.mp3这三段音频是我们最终想要得到的。依次点击:首页→保存,即可完成。官网:https://www.nchsoftware.com/index.html
三、文字识别
对于无法复制的文字,我们可以先截图,然后使用OCR软件进行识别。这里我推荐一个开源免费的工具——PandaOCR,它是一款绿色软件。
使用方法也非常简单,打开软件后,点击右侧栏的"截图识别",将自动在中间转化为文字,还有自动翻译成了英文。这些都是采用了软件的默认设置。对于本文这种文字识别的要求来说,已经足够用了。
这里再介绍一点其他的内容,如果一些扫描文件等比较难以识别的文字,可以使用百度的OCR接口(在线,准确率较高),有一定的免费次数,但是需要申请,这个软件提供了相应的教程,大家可以自行去研究一下。
开源地址:
https://github.com/miaomiaosoft/PandaOCR/releases
备份下载:
https://wwi.lanzoup.com/b00pfo5fa 密码:6aa4
总结
音频转文字,目前来说没有既完全免费、准确率又高的工具。所以我们首先,把音频先用软件分割成几断;然后使用讯飞听见的免费功能进行转化;最后,使用免费的OCR识别工具对文字进行识别。从而实现,白嫖"语音转文字"的功能。
虽然上述方法看上去比较麻烦,其实操作起来非常简单。干净又卫生啊兄弟们~