原贴链接

我在本地运行了SmoLLM 135m这个超小语言模型，与其进行了简短交互，如询问‘你是什么’‘如何做花生酱和果冻三明治’‘列出斯皮尔伯格的最佳电影’‘如何烤一条面包’等问题，它的回答有很多错误之处，所以这些超小模型存在的意义是什么？是否有我没发现的用途呢？

讨论总结

原帖对小型LLMs的实用性表示怀疑，通过与SmoLLM 135m的交互展示其回答存在诸多错误。评论则从多个角度探讨小型LLMs的价值，如可用于特定任务、在特定设备（如老旧设备、边缘设备）上运行，可进行领域微调，在一些场景下能发挥作用（如数据清理、代码自动补全）等，整体氛围是积极探讨小型LLMs存在的意义和用途。

主要观点

👍 小型LLMs可用于特定任务的微调，且在特定场景下有用
- 支持理由：许多评论者指出小型LLMs可针对专门任务进行微调，如在大学研究项目中用于微调/信息检索、数据清理任务、特定的代码自动补全任务等场景下发挥作用。
- 反对声音：部分评论者对小型LLMs的能力表示质疑，认为其作为聊天机器人表现差，在回忆事实方面效果不佳。
🔥 小型LLMs可与大型LLMs协同工作或作为路由导向其他大型LLMs
- 正方观点：有评论者认为小型LLMs可与大型、智能的AI协同工作，如在信息检索方面，小型LLMs检索到的信息可由大型LLM进一步处理得到正确答案；也可作为路由根据问题导向其他大型LLMs。
- 反方观点：有评论者质疑小型LLMs作为路由的决策能力，认为其规模小，决策能力弱。
💡 小型LLMs虽然存在不足，但仍有其存在意义
- 解释：尽管小型LLMs存在知识量有限、回答准确性差等问题，但由于其所需计算资源少、可在本地运行、运行速度快等特点，在一些场景下（如嵌入式应用、特定任务处理）是有价值的。

金句与有趣评论

“😂 The Last of Us”: A classic sandwich (by Steven Spielberg himself) with peanut butter on one side and jelly on the other, this way it always falls face down."
- 亮点：以幽默的方式调侃原帖中模型给出的关于电影《The Last of Us》的错误回答。
“🤔 They exist so you can fine tune them on specialized tasks. Being small means less compute is required. They are not general purpose LLMs.”
- 亮点：简洁地阐述了小型LLMs存在的意义，即用于特定任务的微调且计算资源需求少。
“👀 I might turn this 135m into a Telegram chat bot, it would be a lot of fun to have an AI assistant that’s wrong about everything.”
- 亮点：提出将小型LLM变成聊天机器人，即使总是答错也很有趣的新奇想法。

情感分析

总体情感倾向是积极探讨。主要分歧点在于小型LLMs是否有用，部分人认为小型LLMs虽然存在很多问题，但在特定场景下有价值；而另一部分人则对小型LLMs的能力持怀疑态度，如认为其作为聊天机器人表现差、决策能力弱等。这种分歧可能是由于不同人对LLMs的期望和使用场景的不同导致的。

趋势与预测

新兴话题：探索针对小模型的特殊训练方式，如将小模型串起来，让微调层作为实时反馈回路引入自我评估。
潜在影响：如果小型LLMs能够在更多特定场景下发挥作用，可能会对相关行业产生影响，如在嵌入式设备中的应用可能会改变一些设备的交互方式；在资源有限的情况下，小型LLMs的使用可能会提高效率并降低成本。

详细内容：

《探讨超小型LLM的存在意义与应用》

在Reddit上，一篇关于超小型LLM（如SmoLLM 135m）的讨论引起了众多用户的关注。原帖展示了与SmoLLM 135m的交互过程，其回答在一些方面存在明显错误，进而引发了关于超小型LLM存在意义及用途的热烈讨论。该帖获得了大量的点赞和评论。

讨论焦点主要集中在超小型LLM的用途和局限性。有人认为，由于其规模小，在现有知识储备上存在不足，但如果针对特定领域任务进行微调，仍能发挥良好作用。例如，[SouvikMandal]表示，多数提问需要现有知识，超小型LLM因规模小知识有限，但针对特定任务微调可表现出色。

也有用户分享了个人经历，[divyamchandel]尝试了上下文问答，效果不佳，回答多为无意义内容。

还有用户提出有趣或引发思考的观点，如[ziksy9]称“网上那些自信满满的NPC对于自身错误信息的态度，似乎表明这是有意为之”。

关于超小型LLM的用途，看法众多。有人认为可用于游戏中的NPC聊天，为每个角色加载自定义LoRa，实现不同角色的独特语言风格；也可用于信息提取、路由决策、文本完成和改写等任务。但也有人指出其局限性，如难以准确回答通用知识问题，容易产生幻觉和错误回答。

总的来说，超小型LLM虽存在不足，但在特定任务和特定场景中，通过微调或与其他技术结合，仍有其价值和应用空间。对于其未来的发展和应用，仍有待进一步探索和实践。

讨论总结#

主要观点#

金句与有趣评论#

情感分析#

趋势与预测#

详细内容：#