![Kokoro+Audiblez,电子书转有声书新选择](https://www.zjnav.com/wp-content/uploads/2025/02/1739117886-1739117886-261dcc1611e254a.jpg)
在 免费好用的听书工具推荐 中推荐过 ebook2audiobook ,算得上目前比较好用的电子书转有声书的开源工具。
ebook2audiobook 利用Calibre进行电子书格式转换,使用 Coqui XTTSv2 and Fairseq 进行高质量的文本转语音(TTS)处理。
由于 Coqui XTTSv2 从2023年12月发布后,开源的代码未再更新,对于普通用户而言,对GPU、RAM的硬件配置要求还是有点高。
Kokoro 是一个最新发布的文本语音模型,基于 StyleTTS 2 架构,参数规模仅为82M,远低于目前主流的 XTTS v2 的467M 和 MetaVoice 的1.2B 。
Kokoro目前在 TTS Spaces Arena 排行榜位居第一。
Kokoro 模型支持美式英语、英式英语、法语、韩语、日语和中文普通话。每种语言支持多种音色以及男、女声,每种语音包都经过专业调校,确保音质清晰自然。不过目前还不支持中文或韩文中与英语混合的情况。由于Kokoro 项目的开发者更新较为频繁,应该可以期待会很快完善目前的一些小问题。
开发者 Claudio Santini 在 Kokoro v0.19 基础上开发了 Audiblez,支持将电子书转变成有声书。开发者在Apple M2 MacBook Pro 上,将有 10 万单词的道金斯(Richard Dawkins)《自私基因》转变成有声书共花费了 2 小时时间,可以说性能很不错了,普通用户都能在本地运行。
Kokoro+Audiblez的方案是 ebook2audiobook 之外的一个很不错的选择。
Kokoro:https://huggingface.co/hexgrad/Kokoro-82M
Audiblez:https://github.com/santinic/audiblez
博客文章:https://claudio.uk/posts/epub-to-audiobook.html
Hacker News讨论:https://news.ycombinator.com/item?id=42708773