模型与技术 性能对比

Gemini 2.5 Pro Exp 03 - 25在Livebench中排名第一

[关于gemini - 2.5 - pro - exp - 03 - 25在Livebench排名第一的帖子引发了多方面讨论,包括模型的来源推测、模型能力评估、付费与使用权限、免费资源的请求次数限制等内容,讨论氛围热烈且存在多种观点的交锋]

 ·  · 
模型与技术 新模型发布

Gemini 2.5 Pro构建巨型结构:一次性完成

[围绕Gemini 2.5 Pro制作的巨型结构展开讨论,包括对其用途、制作方式、代码生成等方面的疑问,有否定和不满的声音,也存在幽默调侃和创意联想等情况]

 ·  · 
硬件与部署 其他

黄仁勋谈GPU

[围绕Jensen Huang与GPU相关的视频展开讨论,涉及英伟达商业策略、GPU的多方面内容、企业贪婪等,有不同的观点和多样的情感倾向。]

 ·  · 
硬件与部署 其他

我刚收到新设备

[原帖作者收到新设备,评论围绕设备能运行的Deepseek相关模型展开,包括模型测试、性能指标、基准测试等内容,整体氛围积极且充满技术探讨]

 ·  · 
应用与工具 其他

工作常用的Chonkie库在GitHub消失

[原帖提到Chonkie库在GitHub消失、网站下线,评论中有人提供资源获取方式、猜测消失原因并给出替代方案和解决工作使用中的相关问题等]

 ·  · 
模型与技术 性能对比

开源中的多模态目前很糟糕

[原帖认为开源多模态大语言模型目前糟糕,各公司难以复制OpenAI或Gemini成功,评论者从不同角度阐述开源多模态模型现状、未来、存在的问题等,有多种观点碰撞,整体氛围理性讨论]

 ·  · 
模型与技术 性能对比

DeepSeek-V3.1官方实时评测分数与本地测试结果不匹配

[原帖提出DeepSeek - V3.1官方Livebench分数与本地测试结果不匹配,评论者从官方设置、数据公开情况、技术差异等方面进行讨论,整体氛围较理性平和]

 ·  · 
硬件与部署 性能对比

MacBook Air M4/32gb性能测试数据

[楼主分享M4版MacBook Air的基准测试结果,部分人对性能表示肯定,其他人提出有关测试模型、配置、补充测试等各种疑问,整体氛围积极交流探讨]

 ·  · 
硬件与部署 硬件选择

大学欲自托管大语言模型,求建议与硬件需求

[大学打算自托管大型语言模型,寻求建议和硬件需求估计,评论给出多种观点,包括硬件选择、资金、部署方式等方面的建议]

 ·  · 
其他 其他

AI发展或需更多资金投入

[这是一个由标题“我想我们将需要一个更大的银行账户”引发的关于硬件相关话题的讨论,涉及硬件性能、成本、配置、模型运行速度等多方面内容,讨论氛围较为轻松活跃,包含各种观点和调侃]

 ·  ·