原贴链接

嗨，朋友。我注意到很多新的语音合成（TTS）只能利用CPU或者GPU（但大多只能用Geforce）。有人知道一些能在苹果电脑上运行并且能利用M1及以上GPU的语音合成（TTS）吗？而且要有一些不错的音色。我试过运行CPU版本的，但即使在M1 Max Pro上也非常慢。谢谢大家提供链接或者建议！

讨论总结

这是一个关于寻找能在苹果GPU上运行的最佳TTS的讨论。大家推荐了多种TTS如f5 - tts - mlx、E2 - TTS、ebook2audiobookpiper - tts、coqui tts与VITS模型组合、macos siri语音等，同时也指出了各自存在的问题，像f5 - tts - mlx的句子分割问题、运行速度慢等，并且还讨论了pytorch的漏洞对TTS运行的影响，还有人使用提醒功能关注后续讨论，整体氛围专注于技术交流。

主要观点

👍 推荐f5 - tts - mlx使用苹果芯片GPU但存在句子分割问题。
- 支持理由：可以利用苹果芯片的MLX框架使用GPU。
- 反对声音：处理多句会有电子杂音，运行长句有问题。
🔥 coqui tts与VITS模型在CPU和GPU上相对较快但不能实时运行。
- 正方观点：速度相对较快。
- 反方观点：不能满足实时需求。
💡 认为E2 - TTS声音更自然但未找到合适实现方式。
- 解释：声音方面表现较好，但目前缺乏基于苹果的MLX和CLI推理的实现。
💡 f5 - tts - mix运行时GPU使用率100%且速度慢、风扇全速。
- 解释：从运行时的系统性能监控来看存在这样的性能问题。
💡 不同用户对TTS有不同需求，如实时性和高质量语音。
- 解释：在关于macos siri语音是否为最佳TTS的讨论中体现出不同需求。

金句与有趣评论

“😂 你可以运行[f5 - tts - mlx](https://github.com/lucasnewman/f5 - tts - mlx)，它使用Apple Silicon的MLX框架，从而使用GPU。然而，它目前在Gradio UI版本中缺乏句子分割功能，所以运行较长的句子可能会导致问题。”
- 亮点：详细介绍了f5 - tts - mlx的优缺点。
“🤔 我发现E2 - TTS更好，声音更自然并且忠实于源声音，但我还没有找到一个可行的基于Apple的MLX和CLI推理的实现。”
- 亮点：指出E2 - TTS在声音方面的优势以及目前存在的实现问题。
“👀 我刚刚尝试了f5 - tts - mlx。它对一句话来说还不错 :D 几句话就只会产生电子杂音了 :)”
- 亮点：生动描述了f5 - tts - mlx在不同语句处理上的差异。
“😎 Have you checked out the native selection of voices?”
- 亮点：简洁地给出了一种可能解决问题的途径，即查看苹果电脑原生语音选项。
“🤨 Previous threads are good, but with the pace of development not very confident if the recommendations are still current: "
- 亮点：提醒原帖作者之前的讨论帖可能因为技术发展而过时。

情感分析

总体情感倾向比较中性，主要分歧点在于对不同TTS的评价，如对macos siri语音是否为最佳TTS有不同看法。可能的原因是不同用户有不同的使用场景和需求，导致对TTS的性能、便利性等方面的考量存在差异。

趋势与预测

新兴话题：随着技术发展，已有的TTS可能需要不断优化或者新的TTS会出现来满足在苹果GPU上更好运行的需求。
潜在影响：对语音合成领域来说，如果能找到在苹果GPU上运行良好的TTS，可能会推动更多苹果设备用户使用TTS技术，在有声读物、辅助阅读等方面提供更好的体验。

详细内容：

《关于在苹果 GPU 上运行的最佳 TTS 软件的热门讨论》

在 Reddit 上，有一个题为“Best TTS that can be run on Apple GPU”的帖子引发了广泛关注。该帖主表示，许多新的 TTS 软件要么只能使用 CPU 或 GPU（且大多只支持 Geforce），想知道有没有能在 Mac 上利用 M1+ GPU 且声音效果好的 TTS 软件，还提到运行 CPU 版本速度极慢，哪怕是在 M1 Max Pro 上。此帖获得了众多评论。

讨论焦点主要集中在各种推荐的 TTS 软件及其特点和性能表现。有人推荐运行 f5-tts-mlx，称其使用苹果 Silicon 的 MLX 框架及 GPU，但存在缺乏句子分割等问题。也有人觉得 E2-TTS 声音更自然，不过还未找到与苹果 MLX 和 CLI 推理的可行实现方式。还有用户提到尝试了 f5-tts-mlx，认为它处理单句不错，但处理多句会产生电子杂音。

有用户分享自己使用 coqui tts 与 VITS 模型的经历，指出它在 CPU 和 GPU 上速度相对较快，但存在 pytorch 的版本兼容问题。有人推荐通过“say”命令使用 Mac 系统原生的语音选项。也有人提到使用 macos siri 的语音，认为是最佳选择。

在这些讨论中，存在一些共识。比如大家都在积极寻找能在苹果设备上运行且性能出色的 TTS 软件。同时，不同用户对于各种推荐软件的看法存在差异，主要争议点在于软件的声音质量、运行速度、兼容性以及是否能满足个人需求等。

总之，关于在苹果 GPU 上运行的最佳 TTS 软件的讨论仍在继续，用户们都期待能找到更符合自己需求的解决方案。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#