模型与技术 技术讨论

Vercel系统提示v0版完整泄露

[原帖发布FULL官方v0系统提示和AI模型信息引发讨论,涉及对内容真实性、与不同模型结合操作、标签使用等多方面疑问和观点,总体氛围充满好奇与怀疑]

 ·  · 
模型与技术 技术讨论

分裂大脑(更新) - 我的所学与改进之处

[原帖是关于split brain的更新,评论者们有表示认可、感兴趣的,有给出改进建议的,还有进行技术询问的,整体氛围积极,充满探索精神。]

 ·  · 
模型与技术 技术讨论

HF平台可免下载转换模型为MLX

[原帖分享HF空间可转换模型且无需下载,评论围绕MLX模型转换展开,涉及非苹果硬件运行、量化与否、模型性能与问题等方面,整体氛围积极且富有探索性]

 ·  · 
模型与技术 技术讨论

Phi-4-多模态的未来

[原帖寻求适用于特定硬件的多语言模型,关注Phi - 4 - multimodal的llama.cpp支持情况及其对模型各方面影响,评论给出多种解决方案、对llama.cpp的看法、其他模型支持情况等,整体讨论热度不均]

 ·  · 
模型与技术 技术讨论

LLM温度计项目探索

[原帖介绍一个名为“LLM Thermometer”的项目,评论者们围绕项目提出各种建议如不同的温度推断方法、新的测试提示、工具推荐等,整体氛围积极]

 ·  · 
模型与技术 技术讨论

分裂大脑“DeepSeek - R1 - Distill - Qwen - 1.5B”与“meta - llama/Llama - 3.2 - 1B”

[原帖展示了一个双模型融合的未完成项目,评论者对项目有感兴趣、质疑等不同态度,还涉及模型相关技术探讨、项目优势、潜在价值以及运行环境等方面的讨论]

 ·  · 
模型与技术 技术讨论

Gemini 2.0 PRO不够强?用<系统提示>使其像R1一样思考

[原帖探讨Gemini 2.0 PRO按特定提示思考时长不如R1的问题并寻求改进,评论涉及多种解决思路、对做法的疑惑、相关研究引用等,整体氛围较为理性探讨]

 ·  · 
模型与技术 技术讨论

深探V3/R1推理系统概览

[该讨论围绕DeepSeek - V3/R1推理系统展开,涉及营收成本计算、商业决策、与其他公司对比、开源模型受益等多方面内容,整体氛围积极且讨论深入]

 ·  · 
模型与技术 技术讨论

为何温度为0不佳?通俗易懂解释

[围绕温度为0是否不好展开讨论,存在多种观点,有从模型原理、实验测试等不同角度分析,整体氛围理性且充满技术探讨]

 ·  · 
模型与技术 技术讨论

深擎发布第四弹:双向管道并行算法DualPipe

[这是一个关于DeepSeek的DualPipe双向管道并行算法的讨论,涉及算法原理、作用、效率、对不同运行场景的影响等,同时也包含对原帖语言风格的看法以及对DeepSeek的期待等内容,整体氛围充满技术探讨的氛围。]

 ·  ·