原贴链接

此贴仅包含一个图片链接,无实质可翻译内容

讨论总结

这个讨论是关于“Browser Use”的话题,评论内容涵盖了多个方面。包括对文档声称支持模型却无示例的不满、对langchain的负面看法、关于LLMs视觉能力的推测、对谷歌搜索结果的看法、浏览器使用与搜索API的关系、在Fedora系统上的不兼容等,还有一些分享资源、提供代码示例以及幽默调侃的内容。

主要观点

  1. 👍 文档声称支持某模型却无示例是不妥的
    • 支持理由:readme声称支持但没给示例,让使用者失望。
    • 反对声音:无。
  2. 🔥 langchain缺乏内部一致性且文档不完善
    • 正方观点:使用起来体验差,像是拼凑的东西。
    • 反方观点:无。
  3. 💡 希望有浏览器扩展重新对谷歌搜索结果排序
    • 支持理由:当前谷歌搜索结果存在无用信息。
    • 反对声音:无。
  4. 👍 功能在https://github.com/AK391/ai - gradio被支持且能简单使用
    • 支持理由:给出了代码示例和使用方式。
    • 反对声音:无。
  5. 💡 在Fedora系统上无法使用(推测是相关浏览器)
    • 支持理由:直接表明在该系统上的使用情况。
    • 反对声音:无。

金句与有趣评论

  1. “😂 Obligatory: ‘Do you want Skynet? Because this is how you get Skynet.’”
    • 亮点:以幽默调侃的方式发表评论。
  2. “🤔 The readme says it supports Llama 405B but no examples are provided :(”
    • 亮点:指出文档支持声称与示例缺失的矛盾。
  3. “👀 Its very clearly a bunch of random stuff poorly hacked together.”
    • 亮点:形象地表达对langchain的负面看法。
  4. “😉 I would like a browser extension that could rerank google search results to get rid of the slop.”
    • 亮点:提出对谷歌搜索结果改进的想法。
  5. “👍 also supported in [https://github.com/AK391/ai - gradio](https://github.com/AK391/ai - gradio), use it in a app in a few lines of code”
    • 亮点:清晰阐述功能支持和使用方式。

情感分析

总体情感倾向比较多样化,有负面评价(如对langchain)、疑惑(如对Browser Use是否使用搜索API)、期待(如对重新排序谷歌搜索结果的浏览器扩展)等。主要分歧点在于对langchain的看法,部分人认为它不好用,可能是由于使用体验、文档完善程度等原因。

趋势与预测

  • 新兴话题:基于重新对谷歌搜索结果排序开展创业项目可能成为后续话题。
  • 潜在影响:如果真的有浏览器扩展对谷歌搜索结果重新排序,可能影响用户搜索体验和谷歌搜索的市场份额。

详细内容:

标题:关于浏览器使用的热门讨论

最近,Reddit 上一个有关“Browser Use”的话题引发了广泛关注。该帖子虽然包含一张图片,但因连接错误无法显示(图片链接:https://i.redd.it/xteb6pzp91be1.png)。此话题获得了众多用户的参与,评论数众多。

帖子主要围绕着浏览器使用中的各种问题和可能性展开讨论,比如模型支持、工作流程、语言选择以及与其他技术的结合等。

讨论的焦点与观点主要有以下几个方面: 有人指出 readme 称支持 Llama 405B 但未提供示例,认为模型需要具备处理多图像和工具调用的能力。有用户提供了相关的 repo 链接(https://github.com/browser-use/browser-use),分享个人经历和案例。有人表示不会使用 langchain,认为其是一堆随意拼凑的东西,缺乏内部一致性和紧密关系,文档也不完善,使用起来比自己动手还麻烦。也有人提到如果相关系统不那么混乱难用,能自由切换 LLM 提供者就好了。 还有人提到很多 AI 工具基于 Python 相关的包,有人因不喜欢动态类型而不想安装 Python。有人认为将网站对接到 LLMs 会让人想起特定的项目(https://github.com/AnswerDotAI/llms-txt)。有人希望有能重新对谷歌搜索结果排序的浏览器扩展。有人认为可以通过抓取并将结果传递给 LLMs 来排序。有人表示自己更倾向于自己管理对话。

有人认为对于一些没有 API 的网站,这种方式能提供原本无法实现的访问,网站能提供比 API 更多的上下文和信息。也有人认为从长远来看,用这样的系统抓取网页数据可能更好,因为网页的源代码和 HTML 混乱,而网站的用户体验趋于一致,便于训练 AI 模仿人类行为。

讨论中的共识在于认识到现有技术的一些限制和不足,比如模型的不完善、系统的混乱难用等。

特别有见地的观点比如有人指出不同行业的 API 情况各异,像 Gemini 2.0 这种新的技术出现可能会带来改变。

总之,这次关于浏览器使用的讨论反映了大家对于相关技术的关注和思考,也展示了当前面临的挑战和可能的发展方向。