模型与技术 性能对比

Whisper.cpp是否仍是语音转文本(STT)的王者

[原帖询问Whisper.cpp是否仍是语音转文本(STT)领域的王者并寻求其他优秀STT,评论从Whisper不同版本性能、其他STT推荐、STT是否已解决等方面展开讨论,氛围较为理性探讨]

 ·  · 
模型与技术 性能对比

8GB VRAM下难寻比gemma - 2 - 9b - it - SimPO更好的大语言模型

[原帖作者找不到能在8GB显存下合理运行且比gemma - 2 - 9b更好的LLM,评论者们纷纷给出自己的推荐、看法、经验等,整体氛围较为积极且充满交流]

 ·  · 
模型与技术 性能对比

回顾ChatGPT 3.5:今不如昔

[围绕ChatGPT 3.5展开讨论,对比现在的本地模型,涉及多语言能力、通用知识等方面,还讨论了模型的规模、在创意写作中的表现、技术潜力利用等话题,观点多样且存在争议。]

 ·  · 
模型与技术 性能对比

Hugging Face发布Text Generation Inference TGI v3.0,长提示处理速度比vLLM快13倍

[Hugging Face发布Text Generation Inference TGI v3.0后,大家讨论其性能优势、与其他产品比较、技术相关疑问、使用场景等,整体氛围积极但也有质疑和负面体验]

 ·  · 
硬件与部署 性能对比

Llama 3.1 8B在9种不同RTX GPU上的基准测试(每百万输出令牌0.228美元)

[该帖子展示了Llama 3.1 8b在9种不同RTX GPU上的基准测试结果,评论多为针对测试结果、测试工具以及硬件对比提出疑问,也有少量正面评价]

 ·  · 
模型与技术 性能对比

Qwen/QwQ 32B正确回答时代关键问题,EXAONE 32B和Llama 3.3 70B失败

[原帖关于不同模型对NVIDIA RTX 3090是否有48GB版本这一问题的回答情况,评论围绕NVIDIA 3090显存容量、模型表现展开讨论,氛围既有技术交流也有观点冲突]

 ·  · 
模型与技术 性能对比

EXAONE 3.5 32B使用体验分享

[原帖作者分享EXAONE 3.5 32B模型测试体验,指出存在问题,评论者主要围绕重复惩罚机制、系统提示等对模型表现的影响展开讨论,氛围较为积极探索]

 ·  · 
模型与技术 性能对比

Llama 3.3在OpenRouter上比GPT 4o便宜近25倍,是否名副其实?

[围绕Llama 3.3比GPT 4o在OpenRouter上便宜25倍是否值得追捧展开讨论,涉及性能、价格、应用场景等多方面,有支持也有质疑,整体讨论较全面深入]

 ·  · 
模型与技术 性能对比

Google Gemini实验版1206编码能力强,胜过Claude Sonnet

[帖子主要讨论Google Gemini experimental 1206在编码方面的表现,评论涉及它与其他模型的比较、在不同场景下的表现、存在的限制以及相关的技术搭配等,整体氛围积极]

 ·  · 
模型与技术 性能对比

用谜题破坏Llama3.3 70B(通过Ollama进行4位量化)

[围绕Llama3.3 70B通过Ollama量化后被谜题弄出故障展开讨论,涉及量化对模型的影响、故障的可能原因以及其他模型相关话题,整体氛围积极探索问题]

 ·  ·