原贴链接

这是我之前帖子（https://www.reddit.com/r/LocalLLaMA/comments/1iqynut/audiobook_creator_releasing_version_2/）的后续内容。我将发布我的开源项目的第3版，它有很棒的新功能！新增关键特性：现在有一个直观且易于使用的Gradio用户界面，不用再头疼运行脚本的问题；增加了对通过docker运行应用程序的支持，设置不再麻烦。查看YouTube上的演示视频：https://www.youtube.com/watch?v=E5lUQoBjquo。Github仓库链接：https://github.com/prakharsr/audiobook - creator/。查看短篇小说的多语音示例音频：https://audio.com/prakhar - sharma/audio/generated - sample - multi - voice - audiobook。尝试带有封面、章节时间戳和元数据的示例M4B有声读物：https://github.com/prakharsr/audiobook - creator/blob/main/sample_book_and_audio/sample_multi_voice_audiobook.m4b。更多新功能即将推出！

讨论总结

这个讨论围绕Audiobook Creator发布版本3展开。其中包括对项目现有功能的认可，如角色识别阶段被认可；也有不少建议，像加入orpheus和sesame csm等替代选项、在Github添加发布功能等；还有对其他模型（如OpenAI的TTS模型）能否用于项目的询问，以及对作者辛勤工作的感谢，整体氛围积极且充满对项目进一步发展的期待。

主要观点

👍 建议项目加入orpheus和sesame csm等替代选项以增加阅读细致度
- 支持理由：可以在“阅读”中获得更多细微差别
- 反对声音：无
👍 肯定Audiobook Creator版本3的成果
- 支持理由：项目在角色识别方面很棒，可听性优于一些廉价有声读物
- 反对声音：无
🔥 希望看到orpheus与audiobook - creator结合
- 正方观点：两者结合可能带来更多可能
- 反方观点：无
💡 DIBSSB对sesame ai labs模型在Audiobook Creator中的应用表示关注
- 解释：希望作者尝试并更新结果
💡 认为大家忽略项目已有成果而关注应添加功能
- 解释：大家应看到项目已有的成果，如角色识别很棒

金句与有趣评论

“😂不是要讨厌kokoro - 它很棒 - 但你应该尝试包含orpheus和/或sesame csm等作为替代选项，以在“阅读”中获得更多细微差别。”
- 亮点：提出了对项目改进的建设性意见
“🤔Great job, maybe add a Release to the github as well, so your watchers get notified”
- 亮点：为项目在Github上的操作提出实用建议
“👀Feel like everyone is jumping past the awesomeness of what you’ve done and shared to what they think you should add.”
- 亮点：指出大家忽略项目成果而关注添加功能的现象

情感分析

总体情感倾向是积极的。主要分歧点较少，大家基本都在为项目的发展提出建设性意见。可能的原因是这是一个开源项目，大家都希望它能不断完善，并且对作者的工作表示认可和尊重。

趋势与预测

新兴话题：orpheus与audiobook - creator的结合可能成为后续讨论的话题。
潜在影响：如果项目按照大家的建议不断改进，可能会吸引更多用户使用，对有声书制作领域产生一定影响，提高有声书制作的效率和质量。

详细内容：

标题：Audiobook Creator 发布版本 3 引发热烈讨论

在 Reddit 上，一个关于“Audiobook Creator 发布版本 3”的帖子引起了众多关注。此帖不仅详细介绍了新版本的诸多令人惊喜的新功能，还提供了丰富的链接供大家深入了解。截至目前，该帖子收获了大量的点赞和众多评论。

主要讨论方向集中在对新版本功能的建议与探讨，以及对现有技术模型的比较和评价。

文章将要探讨的核心问题是如何进一步优化 Audiobook Creator 以满足用户的更多需求。

在讨论中，有人提出不应只局限于现有的技术模型，比如建议尝试包括 orpheus 和 sesame csm 等作为更多样化的选择，以增加“阅读”的细微差别。还有人认为 Orpheus 作为新出现的模型，质量和稳定性属于顶级，且比 Zonos 更易于实现。

有人询问作者是否尝试了 sesame ai labs 模型，作者表示还未尝试但会去做。还有人建议在 Github 上添加 Release 以便关注者得到通知，作者对此表示认同。

有人提到 OpenAI 也有新的 TTS 模型，声音非常好，并询问是否可以使用，作者表示会去查看对 OpenAI 模型的支持情况。

也有人对作者的工作表示了极大的肯定和感谢，称赞作者所做的努力，认为其在角色识别和自动分配声音方面做得很棒，已经比一些低价的音频录制好很多。

总之，这场讨论展示了大家对 Audiobook Creator 新版本的期待和关注，不同观点的交流也为该项目的进一步发展提供了有益的思路。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#