嗨,朋友。我注意到很多新的语音合成(TTS)只能利用CPU或者GPU(但大多只能用Geforce)。有人知道一些能在苹果电脑上运行并且能利用M1及以上GPU的语音合成(TTS)吗?而且要有一些不错的音色。我试过运行CPU版本的,但即使在M1 Max Pro上也非常慢。谢谢大家提供链接或者建议!
讨论总结
这是一个关于寻找能在苹果GPU上运行的最佳TTS的讨论。大家推荐了多种TTS如f5 - tts - mlx、E2 - TTS、ebook2audiobookpiper - tts、coqui tts与VITS模型组合、macos siri语音等,同时也指出了各自存在的问题,像f5 - tts - mlx的句子分割问题、运行速度慢等,并且还讨论了pytorch的漏洞对TTS运行的影响,还有人使用提醒功能关注后续讨论,整体氛围专注于技术交流。
主要观点
- 👍 推荐f5 - tts - mlx使用苹果芯片GPU但存在句子分割问题。
- 支持理由:可以利用苹果芯片的MLX框架使用GPU。
- 反对声音:处理多句会有电子杂音,运行长句有问题。
- 🔥 coqui tts与VITS模型在CPU和GPU上相对较快但不能实时运行。
- 正方观点:速度相对较快。
- 反方观点:不能满足实时需求。
- 💡 认为E2 - TTS声音更自然但未找到合适实现方式。
- 解释:声音方面表现较好,但目前缺乏基于苹果的MLX和CLI推理的实现。
- 💡 f5 - tts - mix运行时GPU使用率100%且速度慢、风扇全速。
- 解释:从运行时的系统性能监控来看存在这样的性能问题。
- 💡 不同用户对TTS有不同需求,如实时性和高质量语音。
- 解释:在关于macos siri语音是否为最佳TTS的讨论中体现出不同需求。
金句与有趣评论
- “😂 你可以运行[f5 - tts - mlx](https://github.com/lucasnewman/f5 - tts - mlx),它使用Apple Silicon的MLX框架,从而使用GPU。然而,它目前在Gradio UI版本中缺乏句子分割功能,所以运行较长的句子可能会导致问题。”
- 亮点:详细介绍了f5 - tts - mlx的优缺点。
- “🤔 我发现E2 - TTS更好,声音更自然并且忠实于源声音,但我还没有找到一个可行的基于Apple的MLX和CLI推理的实现。”
- 亮点:指出E2 - TTS在声音方面的优势以及目前存在的实现问题。
- “👀 我刚刚尝试了f5 - tts - mlx。它对一句话来说还不错 :D 几句话就只会产生电子杂音了 :)”
- 亮点:生动描述了f5 - tts - mlx在不同语句处理上的差异。
- “😎 Have you checked out the native selection of voices?”
- 亮点:简洁地给出了一种可能解决问题的途径,即查看苹果电脑原生语音选项。
- “🤨 Previous threads are good, but with the pace of development not very confident if the recommendations are still current: "
- 亮点:提醒原帖作者之前的讨论帖可能因为技术发展而过时。
情感分析
总体情感倾向比较中性,主要分歧点在于对不同TTS的评价,如对macos siri语音是否为最佳TTS有不同看法。可能的原因是不同用户有不同的使用场景和需求,导致对TTS的性能、便利性等方面的考量存在差异。
趋势与预测
- 新兴话题:随着技术发展,已有的TTS可能需要不断优化或者新的TTS会出现来满足在苹果GPU上更好运行的需求。
- 潜在影响:对语音合成领域来说,如果能找到在苹果GPU上运行良好的TTS,可能会推动更多苹果设备用户使用TTS技术,在有声读物、辅助阅读等方面提供更好的体验。
详细内容:
《关于在苹果 GPU 上运行的最佳 TTS 软件的热门讨论》
在 Reddit 上,有一个题为“Best TTS that can be run on Apple GPU”的帖子引发了广泛关注。该帖主表示,许多新的 TTS 软件要么只能使用 CPU 或 GPU(且大多只支持 Geforce),想知道有没有能在 Mac 上利用 M1+ GPU 且声音效果好的 TTS 软件,还提到运行 CPU 版本速度极慢,哪怕是在 M1 Max Pro 上。此帖获得了众多评论。
讨论焦点主要集中在各种推荐的 TTS 软件及其特点和性能表现。有人推荐运行 f5-tts-mlx,称其使用苹果 Silicon 的 MLX 框架及 GPU,但存在缺乏句子分割等问题。也有人觉得 E2-TTS 声音更自然,不过还未找到与苹果 MLX 和 CLI 推理的可行实现方式。还有用户提到尝试了 f5-tts-mlx,认为它处理单句不错,但处理多句会产生电子杂音。
有用户分享自己使用 coqui tts 与 VITS 模型的经历,指出它在 CPU 和 GPU 上速度相对较快,但存在 pytorch 的版本兼容问题。有人推荐通过“say”命令使用 Mac 系统原生的语音选项。也有人提到使用 macos siri 的语音,认为是最佳选择。
在这些讨论中,存在一些共识。比如大家都在积极寻找能在苹果设备上运行且性能出色的 TTS 软件。同时,不同用户对于各种推荐软件的看法存在差异,主要争议点在于软件的声音质量、运行速度、兼容性以及是否能满足个人需求等。
总之,关于在苹果 GPU 上运行的最佳 TTS 软件的讨论仍在继续,用户们都期待能找到更符合自己需求的解决方案。
感谢您的耐心阅读!来选个表情,或者留个评论吧!