通用教程
Overview
软件介绍
批量音频生成
- 支持SRT文件(带时间轴)和TXT文件(无时间轴)批量处理
- 自动递归扫描文件夹中的所有字幕文件
- 支持大规模批量生成任务
智能时间轴对齐
- 自动计算语速(CPM)匹配字幕时间轴
- 智能变速调整音频时长
- 无声音频补偿机制,精确对齐时间轴
- 可设置误差容忍值,灵活控制对齐精度
多角色配音支持
- 内置多种中文语音角色(云希、小晓、小艺等)
- 支持方言语音(东北话、陕西话、台湾话)
- 支持音量、音调自定义调整
- 提供试听功能,方便选择合适角色
高级音频处理
- 支持变速倍率范围设置(0.5-2.0倍)
- 使用Sox进行高质量音频变速
- 使用FFmpeg进行音频合并
- 自动生成MP3格式音频文件
Use Cases
使用场景

视频创作者
若手字幕音频批量生成器帮助视频创作者批量生成视频配音和旁白音频,将字幕文件快速转换为语音,提升视频制作效率。
- 批量将SRT字幕文件转换为配音音频
- 智能匹配字幕时间轴,确保音画同步
- 支持多种语音角色,满足不同视频风格需求

内容制作团队
若手字幕音频批量生成器帮助内容制作团队批量生成课程音频、有声读物等音频内容,将文本内容快速转换为语音,提升音频内容生产效率。
- 批量生成课程和有声读物音频
- 支持大规模音频文件生成
- 提升音频内容制作效率
FAQ
常见问题
软件会自动进行智能调整:如果误差在容忍范围内(默认0.8秒),会添加无声音频补偿;如果误差较大,会自动进行变速调整;可以调整"误差容忍值"和"变速倍率"范围来优化效果
输入格式:SRT(字幕文件,带时间轴)、TXT(纯文本文件,无时间轴);输出格式:MP3音频文件
软件提供试听功能,可以在选择角色时实时试听;不同角色适合不同场景:云希、云健适合男性解说、纪录片;小晓、小艺适合女性播报、课程讲解;方言角色适合特定地区内容
软件支持批量处理,会自动处理文件夹中的所有文件;可以设置代理地址,提升网络访问速度;建议分批处理超大任务,避免长时间占用资源
使用edge_tts生成高质量音频;使用Sox进行变速,保持音质;使用FFmpeg合并,设置128k比特率保证质量
主要支持中文语音(普通话);支持方言:东北话、陕西话、台湾话;部分角色支持英语(需在代码中配置)
软件支持设置代理地址;可以设置错误重试次数(默认3次);如果网络不稳定,建议增加重试次数
默认输出到字幕文件所在目录;可以手动指定输出文件夹;输出文件名与输入文件名相同,扩展名为.mp3
Service
服务保障
💯 兼容性保证
若软件与用户电脑不兼容或无法正常使用,自购买之日起 24 小时内提供全额退款服务。
🛠️ 远程技术支持
提供 QQ 或向日葵远程服务,确保及时解决使用中的任何问题。
✨ 功能定制开发(免费 + 增值)
- 基础定制免费:高需求功能持续更新添加
- 深度开发服务:专业级需求提供付费解决方案