模型与技术 其他

求推荐适合8GB显存的优质图像模型

[原帖寻求8GB VRAM下较好的图像模型,评论者们纷纷推荐不同模型如sd1.5、Flux、flux GGUF Q3、Comfy与Flux gguf、XL、SDXL等并给出相关使用建议,讨论氛围积极友好]

 ·  · 
模型与技术 新模型发布

国外公司发布Mistral、Qwen和DeepSeek模型

[围绕美国内外公司的人工智能模型展开讨论,涉及模型特点、商业策略、开源闭源、招聘规则等多方面,整体氛围热烈且观点多元]

 ·  · 
模型与技术 技术讨论

使Mistral Small 3 24B像R1 - 蒸馏模型那样思考

[原帖关于在Mistral Small 3 24B模型上尝试CoT系统提示引发讨论,包括模型测试结果、提示工程的有效性、思维链与蒸馏的区别等多方面内容,整体讨论热度不高且观点多元]

 ·  · 
模型与技术 性能对比

Phi 4被严重低估

[原帖认为Phi 4被低估,评论者从不同角度发表对Phi 4的看法,有肯定也有否定,还涉及与其他模型的比较等内容,整体讨论氛围较为多元]

 ·  · 
模型与技术 新模型发布

Kokoro TTS 1.0发布

[围绕Kokoro TTS 1.0展开讨论,涉及模型依赖项、运行性能、功能、许可、数据集等方面,情感倾向正负皆有,整体氛围较为理性探讨]

 ·  · 
模型与技术 新模型发布

Mistral Small 3:超越自身规模的性能——重新定义期待(感觉像70B模型!)

[关于Mistral Small 3这个模型,大家从不同方面进行评价,包括在不同任务中的表现、与其他模型对比等,有正面评价也有否定的声音,整体讨论氛围比较理性且多元]

 ·  · 
模型与技术 性能对比

DeepSeek - R1成功解数学题并自我纠错

[原帖讲述DeepSeek - R1解决数学题并探讨其他模型失败原因,评论围绕模型类型、模型能力、数学题答案、解题思路、模型出错原因等展开讨论,整体氛围理性探讨]

 ·  · 
模型与技术 新模型发布

为教育目的从零训练100万参数的TinyStories模型

[原帖作者训练一个用于教育目的的100万参数tinystories模型,评论者们围绕模型表现、训练过程、后续优化等展开讨论,氛围比较积极,有交流也有质疑。]

 ·  · 
模型与技术 其他

斯坦福Co - Storm无人问津?可撰写深度报告

[围绕Stanford Co - Storm展开讨论,有人喜爱有人觉得平庸,还涉及与其他工具比较以及其在搜索能力方面的表现等内容,氛围较为多元]

 ·  · 
模型与技术 其他

无审查与删减模型之间的区别

[在LLMs和AI领域中,关于无审查模型和删减模型(abliterated models)的区别、特点、存在的问题以及相关模型性能等方面展开讨论,存在多种观点且有一定争议]

 ·  ·