语音转文字工具是一款实用性强、基于Python编写的应用程序,它集成了图片、视频语音识别和PDF翻译等多种功能。这款工具能够帮助用户轻松实现音频转文字、文字转语音、截图文字识别等操作。
软件亮点
音频转文字:与市面上大多数收费的音频转文字服务不同,这款工具提供免费的音频转文字功能。您只需上传一段音频,即可立即将其识别为文本。这对于会议纪要的制作非常实用,,它不是即时的语音识别。
文字转换语音:转换后的语音听起来自然流畅。
截图文字识别(OCR):您只需进行手机截图,软件即可识别并弹出图片中的文本内容。
批量图片文字识别:选择多张图片,软件可以立即识别出每张图片中的文本。
拷贝翻译:在阅读外文文献时,如果遇到需要翻译的文章段落,您只需进行复制,软件即可实时监测粘贴板并为您提供多种语言的翻译结果。当然对于无法复制的毕业论文等文本,软件还提供了截图OCR功能,并对OCR结果进行翻译。
图片合成:虽然这个功能并不突出,但它满足了用户的个人爱好,将一张图片和一个压缩包合并成一个图片文档,这个图片文档打开后是一张图片,如果将后缀名改为zip,解压后就能看到原来的压缩包。
软件功能
批量音频转文字:您可以批量选择要转换的音频文件,软件将自动识别并转换为文本。这一功能完全免费,识别速度较快,只需耐心等待即可。
例如批量识别小学生课文
例如识别长达五分钟的《荷塘月色》
文字转换语音:输入文本后,您可以挑选发音人、声音速度和声调等选项,并进行试听,最终生成MP3格式的音频文件。
截图OCR:点击截图按钮即可进行截图,软件会自动弹出并识别图片中的文本。
图片批量识别:在截图OCR功能下方,有一个图片批量文字识别功能,属于OCR功能的一部分。您只需批量选择图片,软件即可识别并提取所有图片中的文本。
拷贝翻译:在阅读外文文献时,如果遇到需要翻译的文章段落,您只需进行复制,软件即可实时监测粘贴板并为您提供多种语言的翻译结果。对于无法复制的毕业论文等文本,软件还提供了截图OCR功能,并对OCR结果进行翻译。
图片合成:将一张图片和一个压缩包合并成一个图片文档,这个图片文档打开后是一张图片,如果将后缀名改为zip,解压后就能看到原来的压缩包。
版本更新
添加了免费的音频转文字接口;
免费支持普通话、英语、广东话、四川话识别,虽然速度较慢,但准确度较高。