模型与技术 新模型发布

波兰数字事务部在HF分享PLLuM模型家族

[围绕波兰数字事务部在HF分享PLLuM模型家族这一事件展开讨论,涉及模型的技术特点、项目情况、意义价值等多方面内容,整体氛围较为积极理性]

 ·  · 
模型与技术 训练与微调技术

发布KoloLLM:可微调用于任何GitHub仓库的LLM

[KoloLLM发布后引发的讨论,包含正面评价、技术建议、改进方向、疑惑及关于相关技术的交流,整体氛围较为平和]

 ·  · 
模型与技术 技术讨论

让旧版大语言模型(Llama 2和Gemma 1)进行推理

围绕让旧版大型语言模型(Llama 2和Gemma 1)推理这一主题展开讨论,涉及相关工作流程、资源,有对这种做法效果的争议,也有对旧版模型其他方面的看法和期望。

 ·  · 
模型与技术 性能对比

Sonnet-3.7在误导性注意力评估中是最佳非思考模型

[原帖讨论Claude - 3.7 - Sonnet在非思考模式下的基准测试结果,评论者表达对基准测试的看法、对模型表现好坏原因的质疑、对不同模型的比较等多种观点,氛围较为积极且充满探索性]

 ·  · 
模型与技术 新模型发布

近期是否有图像模型发布?

[原帖询问是否有新的图像模型发布,评论围绕Flux能否被认真训练、新模型情况、各模型的优势劣势、成人内容对模型的影响等展开,整体氛围理性讨论为主]

 ·  · 
模型与技术 新模型发布

山姆A何时发布o3 - mini级本地模型

[关于Sam A的o3 - mini级别模型在投票获胜后却无本地发布消息,评论者大多表示不信任Sam A会兑现,也有观点认为需要耐心等待,整体氛围偏消极]

 ·  · 
模型与技术 性能对比

是否有人使用KTransformers运行DeepSeek R1的1.58和2.51位量化版本

[帖子询问DeepSeek R1量化相关及不同CPU下数据比较,评论给出资源、性能数据、技术说明、硬件配置及处理器选择相关内容,整体氛围较技术向]

 ·  · 
模型与技术 性能对比

深擎在长文本语境表现出色

[围绕DeepSeek在长文本语境下的表现展开讨论,有对标题的质疑、模型间的比较、不同语境下的表现分析等,讨论氛围较有争议性]

 ·  · 
模型与技术 新模型发布

Llama 4未按时发布,Meta需参与竞争

[围绕Meta未按预期在1月发布Llama 4展开讨论,涉及未发布原因、模型特性、Meta竞争状况等多方面,整体氛围积极且充满各种猜测与分析]

 ·  · 
模型与技术 性能对比

基准测试不可信及示例

[原帖认为基准测试存在问题,评论者们通过各自使用模型的经历、不同模型的比较等,普遍对基准测试能否反映模型能力表示怀疑,整体氛围偏向质疑基准测试的有效性]

 ·  ·