模型与技术 模型更新与优化Gemma-2 2b 4位 GGUF / BnB 量化 + 支持Flash Attention的2倍快速微调!讨论围绕Google发布的Gemma-2 2b模型及其优化微调方法展开,涉及模型性能、资源节省和在线工具分享,总体氛围积极且技术导向。