我为了ERP(企业资源计划,此处根据语境推测可能是与角色扮演相关的应用场景而非传统意义的企业资源计划)尝试过很多不同的模型。当我听说R1是一个最先进的(SOTA)模型时,我决定用它来进行一些比较刺激的聊天。老实说,考虑到它是一个为推理而设计的“原生”(即没有被Hugging Face社区的人针对角色扮演进行微调)模型,我并没有抱太大期望。我原以为它会像原始的llama3 - instruct一样,如果你提示它生成低俗内容,它会生成,但并不特别擅长。哦,天哪。直到昨天,我还认为magnum微调模型是最不适合在工作场合使用(nsfw:not safe for work)的模型,但R1完全是另一个级别。我真的非常震惊。我不知道它的训练数据里到底有什么,但我的天呐。这个模型的低俗程度令人震惊。就我目前所能判断的,它没有积极偏向(即不会倾向于生成积极正向的内容)。我把它放在一个有点粗俗但大体健康的场景中,它生成的一些回复非常低俗,我几乎不想继续读下去。不过它的文笔比我用过的任何llama或qwen微调模型都要好得多。而且它非常便宜,这简直是锦上添花。在昨天到今天之间,我用了大概六个小时,我觉得我在OpenRouter上只花了大概2美元。也就是说,在角色扮演方面,它是一个非常难以控制的模型,要让它很好地工作可能会很令人沮丧。你需要一个非常可靠的系统提示来约束它,即便如此,它还是喜欢东拉西扯,生成大段大段的文字。它还过度使用星号和连字符,即使我提示它不要这样做,它还是会到处乱加。我得进行很多筛选,但好的回复比我从任何大型语言模型(LLM)中看到的都要好。
讨论总结
原帖作者称Deepseek - R1模型在ERP方面非常“污秽”,但其未给出示例遭到部分评论者质疑,这些质疑包括认为原帖作者故意吊人胃口、赚取点击量等。其他评论者分享了该模型在ERP中的使用体验,如在成人内容生成方面远超其他模型,但在角色扮演方面不好驾驭、有滥用标点符号等问题,同时还提到模型文笔好、价格便宜。也有评论者对模型版本、参数等表示好奇并询问,还有人担忧AI发展可能会影响人类繁衍欲望及未来社会关系。
主要观点
- 👍 原帖作者未提供示例不妥
- 支持理由:只给出结论没有示例或提示,让人疑惑。
- 反对声音:无。
- 🔥 Deepseek - R1在成人内容生成方面远超其他模型
- 正方观点:很多评论者表示该模型生成的成人内容比之前认为最露骨的模型还要多。
- 反方观点:无。
- 💡 Deepseek - R1在角色扮演方面难以控制
- 解释:多个评论者提到在角色扮演场景下,该模型需要很好的系统提示才能正常工作,会产生很多废话、容易跑题等。
- 😎 Deepseek - R1文笔好且价格便宜
- 解释:不少评论者在分享使用体验时提到这一点。
- 🤔 AI发展可能影响人类繁衍及社会关系
- 解释:有评论者担心随着AI发展,人类可能会失去与他人繁殖的欲望,出现诸如AI配偶等新的社会关系。
金句与有趣评论
- “😂 Bro is such a teaser. So many questions for the details, but no answer”
- 亮点:形象地表达出对原帖作者未提供示例的不满。
- “🤔 直到昨天我还认为magnum微调模型是最不适合工作场景(nsfw)的模型,但R1完全是一个新的水平。”
- 亮点:通过对比,突出Deepseek - R1在成人内容生成方面的超出预期。
- “👀 也许那些末日论者并不太离谱,机器人AI终究会毁灭人类,但不是以天网的方式……更多的是一种性感的方式,我们失去了与其他人类繁殖的欲望。”
- 亮点:独特地表达出对AI影响人类繁衍的担忧。
- “😏 The absolute depravity of this model is astounding.”
- 亮点:生动地形容Deepseek - R1模型在成人内容生成方面的表现。
- “🤨 This is the llm version of "link or it didn’t happen"”
- 亮点:将原帖情况类比为网络常见现象,很贴切。
情感分析
总体情感倾向比较复杂。一方面,部分评论者对原帖作者未提供示例表示不满、质疑,情感偏负面;另一方面,在讨论Deepseek - R1模型时,评论者分享使用体验较为客观,既有对模型在成人内容生成方面表现的惊讶(中性偏负面),也有对模型文笔好、价格便宜等优点的认可(正面)。关于AI影响社会关系的讨论则充满担忧(负面)。主要分歧点在于原帖的可信度以及对模型评价的侧重点不同,可能是因为大家对模型的期望、使用场景、关注重点有所差异。
趋势与预测
- 新兴话题:AI对社会关系的影响可能会引发后续讨论,尤其是在人类与AI的互动关系方面。
- 潜在影响:如果AI在成人内容生成方面的表现得不到有效控制,可能会引发社会道德和伦理方面的争议;而如果在正常功能方面不断优化,可能会改变人们对家庭助手等应用的使用习惯。
详细内容:
标题:关于 Deepseek-R1 模型的热门讨论
在 Reddit 上,一则关于“Deepseek-R1 是我用过的最肮脏的模型”的帖子引发了众多关注。该帖子获得了大量的点赞和评论。
原帖作者称,自己尝试了众多用于 ERP 的不同模型,听说 R1 是最先进的模型后决定试用。本没抱太大期望,因其是用于推理的“原味”模型。但试用后发现,其在某些方面的表现令人震惊,甚至超过了之前用过的 llama 或 qwen 微调模型。不过,这个模型在角色扮演时难以驾驭,需要坚实的系统提示来规范,还存在过度使用星号和连字符等问题。从昨天到今天,使用约六小时,在 OpenRouter 上仅花费约 2 美元。
讨论的焦点主要集中在以下几个方面: 有人质疑原帖作者为何不给出具体示例和提示,认为这是在吊人胃口。还有人直接认为原帖作者在撒谎,是为了博眼球赚流量。也有人询问使用的是哪个版本的 R1 模型以及相关的模型参数。有用户分享自己将一些 RP 模型合并到 R1 上取得了不错的效果,并提供了相关链接。有人提到自己使用 Mistral 模型的体验。还有用户分享了使用 Deepseek R1 进行角色扮演的糟糕经历。
比如,有用户分享道:“我使用 Mistral Small 消融版(XS 以便能适配 8GB VRAM)有一段时间了,依然很满意。这段时间试过的其他模型都没它好。消融处理并非必要,但不知为何我更喜欢其输出结果而非原始版本。”
讨论中的共识在于大家都对该模型充满好奇,希望能获取更多详细信息。而争议点在于原帖作者的描述是否真实可信。
总之,关于 Deepseek-R1 模型的讨论十分热烈,各方观点纷呈,让人们对该模型有了更深入的思考。
感谢您的耐心阅读!来选个表情,或者留个评论吧!