无实质内容可翻译（仅为一个图片链接：https://llminfo.image.fangd123.cn/images/8wpefk62nt9e1.jpeg!/format/webp）

讨论总结

该讨论主要围绕Deepseek v3在WebDev领域表现不佳展开。部分人认同这一观点并分享了自己使用不佳的经历，也有人提出异议，从不同方面如模型的测试方式、可能的训练数据问题等进行探讨，还涉及到OpenRouter相关的一些疑惑与争议，整体氛围较为热烈且富有争议性。

主要观点

👍 Deepseek v3通过OpenRouter使用表现不佳
- 支持理由：多人提到使用OpenRouter时Deepseek v3表现差，如简单数学问题推理能力差等
- 反对声音：无
🔥 Deepseek v3不适合用一次性任务来测试，该模型价格低可大量迭代
- 正方观点：一次性任务测试不能体现其真正能力，迭代后结果会不同
- 反方观点：无
💡 对Deepseek v3在WebDev领域表现差的说法表示惊讶，认为其与其他模型表现相当
- 解释：有人根据自己的使用经历，使用预设提示词调用DeepSeek时，其表现与其他模型相当
💡 认为Openrouter若用旧版本冒充新版本属于虚假宣传
- 解释：如果Openrouter声称使用v3版本实际使用v2版本，这种做法应是非法的
💡 认为Deepseek v3在WebDev领域表现差可能与训练数据有关
- 解释：从训练数据的角度提供了一个可能导致表现不佳的原因

金句与有趣评论

“😂 Deepseek 3 through OpenRouter seems to be lobotomized, according to some other threads.”
- 亮点：形象地描述了Deepseek 3通过OpenRouter使用时表现差的情况
“🤔 openrouter I think still uses the old 2 version and say it’s the new one 3. scumbags”
- 亮点：直接表达对Openrouter可能存在虚假宣传行为的不满
“👀 I only tried with OpenRouter, and it was so dumb I just couldn’t believe it.”
- 亮点：强调了仅用OpenRouter测试时Deepseek 3表现之差令人难以置信
“😉 That should be illegal. It’s false advertising.”
- 亮点：指出可能存在的虚假宣传行为是非法的
“🙄 Got DeepSeek a few times with canned prompts yesterday and it was comparable to Sonnet, o1, and o1 - mini on them.”
- 亮点：给出与其他模型比较的结果，对Deepseek 3表现差的观点提出异议

情感分析

总体情感倾向为中性偏负面，主要分歧点在于Deepseek v3在WebDev领域的表现到底如何。认同表现不佳的人大多基于自己使用时的不好体验，而持反对意见的人则从不同角度如测试方式、自身使用情况等进行反驳，可能的原因是大家使用的场景、测试方式以及对模型的期望不同。

趋势与预测

新兴话题：可能会进一步探讨Deepseek v3的训练数据具体如何影响其在WebDev领域的表现。
潜在影响：如果能确定Deepseek v3在WebDev领域表现不佳的真正原因，可能会影响其在该领域的推广和使用，也可能促使开发方对模型进行改进。

详细内容：

标题：关于 Deepseek v3 在 WebDev Arena 表现的热门讨论

近日，Reddit 上一则关于“Deepseek v3 在 WebDev Arena 表现不佳”的帖子引发了广泛关注。该帖子收获了众多点赞和大量评论。帖子主要探讨了 Deepseek v3 在 WebDev Arena 中的各种问题，引发了大家对于其性能、使用方式以及与其他模型对比等方面的热烈讨论。

讨论的焦点主要集中在以下几个方面：有人表示通过 OpenRouter 使用 Deepseek 3 似乎效果不佳，而尝试 Deepseek 自身的 API 则有天壤之别。比如有用户分享道：“我只用了 OpenRouter，效果差得让我难以置信。对于一个简单的数学问题，推理能力非常糟糕。” 但也有人质疑 OpenRouter 是否真的不好用，认为其方便。还有人提到 Together.ai 成为 Deepseek v3 的新提供者，猜测其版本可能更好。同时，关于 OpenRouter 是否存在虚假宣传、使用旧版本等问题也引发了争议。

有人认为 Deepseek v3 可能在训练数据方面存在差距，不太适合用于 Web 开发，比如有用户说：“我主要用 llm 处理.js 和.py，Deepseek 对我来说效果并不好。” 但也有人表示使用效果不错。

在讨论中，大家的共识在于都在关注 Deepseek v3 在 WebDev Arena 的实际表现和改进空间。一些独特的观点如“有时候 V3 在 LMArena 对于最简单的提示会返回完整的推理链，几乎像是不小心指向了其他模型”，丰富了讨论的深度。

总的来说，关于 Deepseek v3 在 WebDev Arena 的表现，大家看法不一，但都希望能有更出色的性能和更明确的使用说明。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#