模型与技术 技术讨论

OpenAI隐藏o3 - mini中的实际思考标记

[原帖质疑OpenAI在o3 - mini中隐藏实际思维标记,众多评论从不同角度发表看法,包括对OpenAI行为的认同、质疑、推测以及对ChatGPT问题的讨论,整体氛围热烈且观点多元]

 ·  · 
模型与技术 性能对比

Mistral、ChatGPT和DeepSeek处理敏感话题的方式

[围绕Mistral、ChatGPT和DeepSeek处理敏感话题展开讨论,涉及不同模型对各类敏感话题(如协助自杀、政治、种族等)的处理能力、审查机制、用户对其的不同看法及相关争议]

 ·  · 
模型与技术 新模型发布

Glyphstral - 24b:符号演绎推理模型

[原帖分享关于Glyphstral - 24b符号演绎推理模型的训练情况即将发布成果,评论主要是表达期待、提问、分享经验、寻求资源等,整体氛围积极且充满好奇]

 ·  · 
模型与技术 性能对比

OpenAI o3 - mini对比r1和o1的性能分析

[原帖对OpenAI o3 - mini与r1、o1进行比较,评论围绕模型在查询限制、编码、测试中的表现等方面展开,有不同观点且情感倾向不一]

 ·  · 
模型与技术 训练与微调技术

AI模型如何在网络英语良莠不齐的情况下正确作答

[针对模型在网络英语良莠不齐的情况下总能正确回答的现象,大家从模型训练方式、数据处理、模型原理等多方面进行解释,整体氛围积极探讨]

 ·  · 
模型与技术 性能对比

双AMD Epyc系统中llama.cpp的令牌生成性能差的可能解决方案

[原帖探讨双AMD Epyc系统上llama.cpp中标记生成性能差的解决方案,评论者有表达感谢、对技术细节提出疑问、探讨性能相关情况等内容,整体氛围平和理性]

 ·  · 
模型与技术 其他

Dolphin3.0 - R1 - Mistral - 24B相关资源链接

[关于Dolphin3.0 - R1 - Mistral - 24B,大家从期待其表现、提出疑问、进行模型对比等多方面展开讨论,整体氛围积极且充满技术探讨氛围]

 ·  · 
模型与技术 模型更新

OpenAI为用户更新思维链

[围绕OpenAI的思维链更新展开讨论,涉及更新内容未完全展示、免费使用权限、与其他技术对比等多方面内容,同时也提到了DeepSeek相关影响,讨论氛围有质疑、不满也有正面评价]

 ·  · 
模型与技术 训练与微调技术

Qwen2.5 0.5B在谷歌Colab T4上全模型GRPO训练脚本,30分钟内GSM8K评估提升25%

[有人分享了在免费Google Colab T4上运行Qwen2.5 0.5B全模型GRPO训练的脚本成果,包括30分钟内提升模型分数等,评论者围绕模型本身、脚本优化、内存等方面展开讨论,整体氛围积极]

 ·  · 
模型与技术 性能对比

使用经典小猫提示与“Dolphin 3.0 R1 Mistral 24b”得到怪异回复

[原帖讲述使用特定提示与Dolphin 3.0 R1 Mistral 24b交互得到奇特回应,评论从模型特性、运行条件、创作能力等多方面展开讨论,整体氛围较理性探讨]

 ·  ·