MS-TTS/Edge-TTS免费文本转语音,一键合成导出MP3音频V2.0.3.2下载

一一分享 办公软件 来源: 0 189 368 阅读模式

软件简介:

众所周知,微软的TTS文本转语音效果非常好,非常接近真人,以至于现在网上非常多营销号,个人用户都在使用。该软件由治廷君使用微软接口制做,可以方便的进行文字转语音。
微软官方地址:
https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech

重要说明

MS-TTS使用的是微软文本转语音演示DEMO页面接口,每次合成内容有长度限制以及合成频率限制,长度限制你们不用管,由软件自动分段切割,合成频率这块软件基本已经调整到了最高上限,千万不要自作聪明多开,免得搞一晚上到最后一个都合成不了还跑来问为什么。
Edge-TTS使用的是edge浏览器大声朗读接口,合成条件相对较宽松,但不支持对语言角色进行深度调整,对语音角色没有特别强的定制需求推荐使用Edge-TTS,接口稳定,合成速度快。

视频教程

https://www.bilibili.com/video/BV1Tk4y1Y7h2/

文字教程(以下内容请仔细阅读)

1、下载的压缩包记得先解压缩,再使用!!!

2、解压后运行主程序 MS-TTS.exe 或Edge-TTS.exe(注意:软件有加密保护,会被部分杀毒软件和电脑管家勿报及限制操作权限,建议将杀毒软件及电脑管家关闭后使用,当然,如果不放心,可以不要使用)

3.1 选项

质量:导出音频文件质量

语言:TTS文本转语音中的文本内容所属语言(一定要和合成内容的语言相对应)

语音:根据所先语言不同,对应的语音角色也不相同,要自行根据实际情况选择

语速:语音合成时的说话速度,0是正常水平,>0加快,<0减慢

音调:语音合成时的说话音调,0是正常水平,>0音调升高,<0音调降低

添加角色:可将设置好的角色添加到下方的角色列表,用于文本转语音时实现多角色配音的效果(不添加角色时,所有语音合成直接使用上方角色及各项设置)

  • 保存:保存当前接口角色列表中的角色数据

  • 载入:载入之前保存过的角色列表数据

  • 删除:删除指定角色(删除角色后为同步角色序号将会自动执行保存功能)

  • 清空:清空列表所有角色数据

全局旁白:合成内容中所有未指定角色内容,统一使用左侧中间部分角色信息进行合成。

3.2 简单模式-中小文本

主要用于合成文本内容不多的情况,可以更为方便快捷的对文本内容进行各种自定义

全局间隔,主要用于一键设置全文所有语句间隔停顿时间。

在编辑区域点击鼠标右键,会弹出右键菜单

  • 粘贴:将复制好的文本内容粘贴到编辑区域

  • 清空:清空编辑区域所有内容

  • 插入间隔:插入指定时长停顿

  • 设置角色:使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。

3.3 简单模式-超长文本

在表格区域点击鼠标右键,会弹出右键菜单:

  • 导入:导入需要进行tts合成的txt文本文件

    • 导入的txt文本大小不能超过5MB(超过5MB文本文件无法导入)

    • 导入的txt文本文件编码格式必须为UTF-8,非UTF8编码文件在导入后,在状态栏会显示“编码错误”,在进行tts语音合成时,会直接跳过

  • 清空:清空列表

  • 也可以直接选中多个txt文本文件,拖动到软件界面完成导入

3.4 软件设置

  • 保存目录:可自定义合成音频保存目录(打开:快速打开保存目录,选择文件夹:选择保存目标文件夹)

  • 合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_tts”进行命名

  • 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)

  • 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时间会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)

  • 合成结束删除1级音频片段:1级音频片段就是最多的,4位数字开头的音频片段文件

  • 合成结束删除2级音频片段:2级音频片段就是按照上面指定分段音频合并数量对1级音频片段进行合并后生成的3位数字开头音频文件

  • 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。

  • 路径检测显示YES表示路径正常,可正常进行音频合并,NO表示软件保存完整路径中存在空格(),;等特殊特殊字符,需要将路径中的特殊字符去除才可以(最简单的解决方法,将软件解压缩,或是剪切到磁盘根目录,除了C盘其它哪个盘都行,有的电脑系统C盘软件操作需要额外权限)

  • 保存配置:将各项设置内容保存至配置文件

注:删除音频片段时,将遵循保护性逻辑,即:在只存在1级音频片段时,即使勾选合成结束删除1级音频片段也不会执行删除,在同时存在1级音频片段与2级音频片段时,勾选删除1级音频片段生效,而2级音频片段即使勾选删除将不会执行,同理,在同时存在1级、2级音频片段,且进行了最终完整合并的前提下,勾先删除1级、2级音频片段才会生效执行。

4、多音字

MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,

将需要自动替换的内容按照:
原始内容,替换内容
的格式一行一条,写入“dict.txt”词典文件保存即可,dict必须为utf-8编码),如下:

直接使用拼音替换指定多音字,例如:wēn,wén,wěn,wèn

5、试听合成

5.1 试听

单角色提供最长不超过3000字符内容的角色声音试听,存在多角色时,只能试听第一段内容;

5.2 合成

按照设置好的角色对指定内容进行TTS语音合成

5.3 全局旁白

老版本合成内容角色设置要么全部设置角色,要么全部不设置,在合成内容中同时存在指定角色内容和未指定角色内容时,只能合成指定角色内容,当前版本合成音频时,指定角色内容使用左下方角色列表中指定角色进行合成,未指定角色内容全部使用左侧中间角色数据进行合成,因为这部分内容不需要指定角色,也以叫全局旁白;

5.4 停止

停止正在进行的任务

5.5 更新

为大家减少麻烦,软件已启用自动更新,当软件检测到新版本后会自动下载新版本,下载完成后重新运行即可,**重点:更新时会自动打本页面,请务必仔细阅读更新内容,方便掌握最新功能。

软件报病毒

软件有加密保护,会被部分杀软误报,所以,如果你在使用过程中遇到这样或那样的问题,请尝试关闭各类杀毒软件或电脑管家后再试一下,当然:如果不放心请勿使用,谢谢!!!

常见问题:合成正常,但无法进行最终合并

  • 1、检查软件保存完整路径以及输出音频保存路径是否存在空格(),;等特殊特殊字符,如有,需要将路径中的特殊字符去除;

  • 2、彻底退出杀毒软件/电脑管家,鼠标右键-使用管理员模式运行此程序;


本站信息来自网络,版权争议与本站无关,您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 访问和下载本站内容,说明您已同意上述条款。联系:39070187@qq.com

weinxin
我的微信
声明
本站所发布的软件和文章仅限用于学习和研究目的,不得将上述内容用于商业或者非法用途,否则一切后果请自负。
 
PC & Mac 办公必备专享捆绑包
评论  0  访客  0  作者  0
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

拖动滑块以完成验证