此贴仅包含一个图片链接,无实质可翻译内容
讨论总结
这个讨论是关于“Browser Use”的话题,评论内容涵盖了多个方面。包括对文档声称支持模型却无示例的不满、对langchain的负面看法、关于LLMs视觉能力的推测、对谷歌搜索结果的看法、浏览器使用与搜索API的关系、在Fedora系统上的不兼容等,还有一些分享资源、提供代码示例以及幽默调侃的内容。
主要观点
- 👍 文档声称支持某模型却无示例是不妥的
- 支持理由:readme声称支持但没给示例,让使用者失望。
- 反对声音:无。
- 🔥 langchain缺乏内部一致性且文档不完善
- 正方观点:使用起来体验差,像是拼凑的东西。
- 反方观点:无。
- 💡 希望有浏览器扩展重新对谷歌搜索结果排序
- 支持理由:当前谷歌搜索结果存在无用信息。
- 反对声音:无。
- 👍 功能在https://github.com/AK391/ai - gradio被支持且能简单使用
- 支持理由:给出了代码示例和使用方式。
- 反对声音:无。
- 💡 在Fedora系统上无法使用(推测是相关浏览器)
- 支持理由:直接表明在该系统上的使用情况。
- 反对声音:无。
金句与有趣评论
- “😂 Obligatory: ‘Do you want Skynet? Because this is how you get Skynet.’”
- 亮点:以幽默调侃的方式发表评论。
- “🤔 The readme says it supports Llama 405B but no examples are provided :(”
- 亮点:指出文档支持声称与示例缺失的矛盾。
- “👀 Its very clearly a bunch of random stuff poorly hacked together.”
- 亮点:形象地表达对langchain的负面看法。
- “😉 I would like a browser extension that could rerank google search results to get rid of the slop.”
- 亮点:提出对谷歌搜索结果改进的想法。
- “👍 also supported in [https://github.com/AK391/ai - gradio](https://github.com/AK391/ai - gradio), use it in a app in a few lines of code”
- 亮点:清晰阐述功能支持和使用方式。
情感分析
总体情感倾向比较多样化,有负面评价(如对langchain)、疑惑(如对Browser Use是否使用搜索API)、期待(如对重新排序谷歌搜索结果的浏览器扩展)等。主要分歧点在于对langchain的看法,部分人认为它不好用,可能是由于使用体验、文档完善程度等原因。
趋势与预测
- 新兴话题:基于重新对谷歌搜索结果排序开展创业项目可能成为后续话题。
- 潜在影响:如果真的有浏览器扩展对谷歌搜索结果重新排序,可能影响用户搜索体验和谷歌搜索的市场份额。
详细内容:
标题:关于浏览器使用的热门讨论
最近,Reddit 上一个有关“Browser Use”的话题引发了广泛关注。该帖子虽然包含一张图片,但因连接错误无法显示(图片链接:https://i.redd.it/xteb6pzp91be1.png)。此话题获得了众多用户的参与,评论数众多。
帖子主要围绕着浏览器使用中的各种问题和可能性展开讨论,比如模型支持、工作流程、语言选择以及与其他技术的结合等。
讨论的焦点与观点主要有以下几个方面: 有人指出 readme 称支持 Llama 405B 但未提供示例,认为模型需要具备处理多图像和工具调用的能力。有用户提供了相关的 repo 链接(https://github.com/browser-use/browser-use),分享个人经历和案例。有人表示不会使用 langchain,认为其是一堆随意拼凑的东西,缺乏内部一致性和紧密关系,文档也不完善,使用起来比自己动手还麻烦。也有人提到如果相关系统不那么混乱难用,能自由切换 LLM 提供者就好了。 还有人提到很多 AI 工具基于 Python 相关的包,有人因不喜欢动态类型而不想安装 Python。有人认为将网站对接到 LLMs 会让人想起特定的项目(https://github.com/AnswerDotAI/llms-txt)。有人希望有能重新对谷歌搜索结果排序的浏览器扩展。有人认为可以通过抓取并将结果传递给 LLMs 来排序。有人表示自己更倾向于自己管理对话。
有人认为对于一些没有 API 的网站,这种方式能提供原本无法实现的访问,网站能提供比 API 更多的上下文和信息。也有人认为从长远来看,用这样的系统抓取网页数据可能更好,因为网页的源代码和 HTML 混乱,而网站的用户体验趋于一致,便于训练 AI 模仿人类行为。
讨论中的共识在于认识到现有技术的一些限制和不足,比如模型的不完善、系统的混乱难用等。
特别有见地的观点比如有人指出不同行业的 API 情况各异,像 Gemini 2.0 这种新的技术出现可能会带来改变。
总之,这次关于浏览器使用的讨论反映了大家对于相关技术的关注和思考,也展示了当前面临的挑战和可能的发展方向。
感谢您的耐心阅读!来选个表情,或者留个评论吧!