原贴链接

嗨,我是Concedo,又来测试KoboldCpp能支持多少API端点了。今天发布的版本带来了期待已久的TTS(文本转语音)支持,它适用于所有版本的OuteTTS GGUF,包括新发布的v0.3 500M和1B模型。它还提供XTTS和与OpenAI语音兼容的API,因此它可以作为使用这些功能的现有前端的直接TTS插件。还有一些非常酷的改进以及许多其他功能,如果还没看的话,可以查看发布说明。上次发布时,我们还添加了网络搜索和一个简单的基于浏览器的RAG(检索增强生成),如果错过了可以去看看。https://github.com/LostRuins/koboldcpp/releases

讨论总结

这是关于KoboldCpp 1.82版本发布的讨论。该版本包含TTS支持等新功能,大家对这个版本发布的看法多样。有人认可KoboldCpp的发展进步,有人分享使用体验,还有人提出问题、表达期待或者进行相关技术的对比等,整体氛围较为积极,大家都从各自角度探讨KoboldCpp相关的话题。

主要观点

  1. 👍 KoboldCpp在不断发展进步,功能不断增加
    • 支持理由:如1.82版本增加TTS支持等多种新功能,之前版本也有新功能添加
    • 反对声音:无
  2. 🔥 认可KoboldCpp此次发布的价值
    • 正方观点:此次发布包含期待已久的TTS支持等功能
    • 反方观点:无
  3. 💡 KoboldCpp中自定义语音功能使用时不能完全控制结果
    • 解释:输入文本种子获取语音,但结果难以完全掌控
  4. 💡 ollama存在不足,即不支持Vulkan
    • 解释:与KoboldCpp不断增加功能对比得出
  5. 💡 对OllamaApi表示高兴
    • 解释:未详细阐述原因,但表现出积极态度

金句与有趣评论

  1. “😂 Kobold is really making great strives to be king of the hill for their niche.”
    • 亮点:形象地表达出Kobold在细分领域积极进取的状态
  2. “🤔 Kobold won! You’ve won me back with this release! ;)”
    • 亮点:生动地体现出KoboldCpp此次发布赢得用户回归
  3. “👀 Oh, fun with custom voices! You’re not really in control over the outcome though as you only give it some text as seed.”
    • 亮点:对自定义语音功能的有趣评价

情感分析

总体情感倾向是积极的。主要分歧点较少,多数人对KoboldCpp 1.82版本的发布表示认可或正面态度。可能的原因是该版本带来了新功能,满足了部分用户需求或者让用户看到KoboldCpp不断发展进步的趋势。

趋势与预测

  • 新兴话题:关于KoboldCpp中功能优化的讨论,如OuteTTS处理长文本问题的解决。
  • 潜在影响:对相关自然语言处理和语音合成技术的发展有推动作用,激励更多用户尝试KoboldCpp并探索其在不同场景下的应用。

详细内容:

《KoboldCpp 1.82 版本引发 Reddit 热议》

近日,Reddit 上关于 KoboldCpp 1.82 版本的讨论热度颇高。该帖子由 Concedo 发布,介绍了此版本新增的长期期待的 TTS 支持,包括对所有版本 OuteTTS GGUFs 的支持,还提供了 XTTS 和 OpenAI Speech 兼容的 API。此帖获得了众多关注,评论数众多。

讨论焦点主要集中在以下几个方面: 有人称赞 Kobold 在其领域内取得了巨大进步,甚至有人表示被新版本赢回了芳心,并希望能添加 Kokoro。还有人指出 OuteTTS 背后实际上是语言模型,处理起来非常容易。有人对 Home Assistant 集成的相关实现进行了分享,并说明了使用方式。有人提到了对不同语音模型的喜好和体验,如喜欢 Kokoro 胜过其他。同时,也有人对版本中的一些功能提出疑问,比如是否有关于助手的文档、能否使用自定义名称、能否处理更长的文本等,都得到了相应的回复和解释。

比如,有用户分享道:“作为一名长期使用 KoboldCpp 的用户,尽管曾暂时切换到 TabbyAPI,但这个新版本提供了我构建完全本地化的 4o 式音频+视频助手所需的最后组件,因此我很高兴能回归。”

有人表示:“如果 Llamacpp 能支持 Kokoro 会很有帮助,因为现有的 TTS 实现很大程度上基于 llamacpp 的实现。”

关于 OuteTTS 0.3 1b 处理长文本的问题,有人指出这有时是模型遇到无法处理的输入导致的,输出受限于 4096 个令牌。

讨论中的共识在于大家对新版本的关注和期待,以及对各种功能的积极探讨和交流。

特别有见地的观点是有人对 RAG 部分的清晰解释,指出其并非基于嵌入的解决方案,而是一种文本搜索算法。

总之,KoboldCpp 1.82 版本的发布在 Reddit 上引发了广泛而深入的讨论,为用户带来了新的体验和思考。