行业与社区 其他

深度伪造技术发展之快超乎想象

[原帖感叹深度伪造技术发展得很好并附视频,评论者们从技术是否为AI、对视频内容的感受、人物外貌逼真度、相关工具等方面进行讨论,整体氛围较为轻松且多元]

 ·  · 
应用与工具 其他

8200万参数的语音合成适用于边缘AI,谁用Kokoro构建语音助手?

[围绕Kokoro在82m参数下适用于边缘人工智能展开讨论,涉及模型的性能、协议、技术使用问题、成本等多方面,整体氛围积极且充满探索欲]

 ·  · 
模型与技术 其他

本地能与ElevenLabs质量和稳定性相匹配的TTS模型

[原帖作者寻求能与ElevenLabs在质量和一致性方面相匹配的本地TTS模型,尝试多种后失望,评论者们推荐了各种模型如Kokoro、Tortoise TTS + RVC等,并提及模型的优缺点、使用限制等内容,整体氛围积极交流且信息丰富]

 ·  · 
应用与工具 其他

超差手写体的光学字符识别(OCR)工具

[关于识别非常差的手写体的OCR工具的讨论,包含对工具的推荐、技术相关的看法、对笔迹难辨认的调侃和多种尝试解决的建议,整体氛围活跃且观点多样]

 ·  · 
硬件与部署 其他

为何无支持llama.cpp之外后端的类似应用

[原帖提问为什么没有支持除llama.cpp之外后端的类似应用,评论从技术、需求、资源等多方面给出解释,整体氛围是理性探讨]

 ·  · 
其他 其他

o3 - mini即将到来

[围绕o3 - mini即将推出展开讨论,包括与其他产品比较、性能预期、产品模式、价格等方面,整体氛围积极为主]

 ·  · 
模型与技术 其他

莫恩德瑞姆2b新凝视检测脚本分享

[帖子关于Moondream 2b的凝视检测脚本,很多人表示感兴趣,也有人担忧该技术被用于员工监控,同时还有人对脚本的应用场景等进行了讨论]

 ·  · 
其他 其他

前OpenAI员工与现员工就o1相关看法

[围绕o1是否只是一个LLM展开讨论,涉及推理过程、图灵完备等特性,观点有分歧,整体氛围热烈]

 ·  · 
硬件与部署 其他

eBay上售价4700美元的RTX 4090 48GB是否合法

[围绕eBay上RTX 4090 48GB售价4700美元是否合法展开讨论,涉及硬件改装、价格合理性、性价比对比等多方面观点]

 ·  · 
模型与技术 其他

2025年信息检索的最佳嵌入模型

[关于2025年信息检索最佳嵌入模型的讨论,涉及LLMs在图表转表格方面的不足、不同模型对比、嵌入器的问题、链接失效及对特定模型如ModernBERT的疑问等内容,整体氛围较为理性探讨]

 ·  ·