模型与技术

Cortex支持Small - Thinker - 3B，一个基于Qwen2.5 - 3b - Instruct微调的小推理模型

[该讨论围绕cortex支持small - thinker - 3B模型展开，涉及模型的使用、性能、相关数据集、未来发展以及对cortex概念的疑问等，整体氛围积极且充满探索性]

[关于Fireworks托管Deepseek V3的话题引发讨论，包括可信度、数据隐私、价格等方面，存在争议也有认可，总体氛围较复杂。]

[帖子围绕关于模型的一些论断展开讨论，包含模型关系、价格差异等方面，有赞同、质疑等不同态度，整体讨论氛围理性且充满探索性]

[帖子询问Moshi的情况以及为何不热门，评论从Moshi体验差、与其他模型比较、模型功能及发展策略等多方面进行讨论，整体氛围以负面评价Moshi为主]

[在ollama模型大小随上下文增加而增加的背景下，大家展开技术讨论，涉及模型架构、内存计算等多方面内容，整体氛围理性客观]

[这是一个关于µLocalGLaDOS - offline Personality Core的讨论，包含项目成果、在不同设备上的运行情况、创意想法等内容，整体氛围积极且充满探索性]

[原帖寻求不色情、自然中性且无审查的模型，评论者们纷纷推荐自己认为合适的模型并讨论相关模型的特点、存在的问题以及与审查、性暗示等方面的关系]

[帖子对多个LLM模型进行比较/测试，评论围绕模型表现、测试准确性、特定模型评价、基准测试选择、模型盈利模式等方面展开，整体氛围以理性探讨为主]

[原帖提到本地LLM首次得到引用，评论围绕引用错误、模型表现、结果偏离等展开，有疑惑、赞同等多种态度]

[原帖比较DeepSeek v3和Claude 3.5 Sonnet在代码编写方面的差异，评论主要围绕对二者的看法、是否存在过度设计、对新手的友好性、性价比等展开，同时还涉及对原帖是否为AI撰写的怀疑。]