我在使用最新的Claude 3.5 Sonnet时遇到了一件怪事,让我有点不安。我经常通过API使用它,主要是在它的测试平台(控制台环境)上。最近,我让它为我的项目编写一个LICENSE(许可协议)和README(自述文件),不知怎么的,它在MIT许可协议里写了我的全名。问题是,在那个会话中我只给了它我的名字,而且我的姓氏非常罕见。我仔细检查了我们的整个对话,以确保我没有不小心提到它,但确实没有,我的姓氏从未出现在交流中。现在我想知道……Claude是不是以某种方式根据我过去的交互、我的GitHub资料或者其他我以为我已经选择不提供的内容进行了训练?而且,在我与API供应商的所有交互中,我提供个人信息这种情况是非常罕见的……有没有其他人遇到过这样诡异的事情?一想到我的名字可能会随机出现在其他人面前,我就感到不安。如果你们有类似的经历或想法,希望能听到。
讨论总结
原帖作者分享Claude 3.5在只知道其名的情况下写出其全名的隐私怪异经历,引发众多评论。评论者们从多个角度进行探讨,包括调侃隐私侵犯可能升级、从技术层面分析可能的原因、推测Claude获取信息的来源等,大家对这一现象既感到好奇又有担忧。
主要观点
- 👍 认为在互联网透露信息可能导致更多隐私问题
- 支持理由:一旦在互联网上透露信息,可能像连锁反应一样引发更多隐私泄露情况,如被展示孩子照片等。
- 反对声音:无。
- 🔥 Claude可能从用户的网络作品中学习到相关信息从而猜出姓氏
- 正方观点:如果用户有网络存在,Claude可能从其作品中学到相关信息。
- 反方观点:无。
- 💡 遇到模型使用未提供的个人信息的情况可以询问模型来源
- 解释:有评论者分享自己类似经历,模型能指出信息来源,所以可以尝试询问。
- 💡 模型可能会因为提到了部分名字而假设出完整姓名
- 解释:根据部分用户与模型交互的经验推测得出。
- 💡 公司不能使用非公开数据训练模型
- 解释:从数据使用规则和模型训练的正常逻辑出发,公司应遵守相关规定。
金句与有趣评论
- “😂 tomz17: Well now that you ran your mouth on the internet it’s going to have to show you a photo of your kids next.”
- 亮点:以一种调侃的方式,生动地表达出在互联网透露信息可能导致更严重隐私问题的观点。
- “🤔 Internet is vast and it’s been trained on the majority of it– is it not theoretically possible that there are associations between things you have given it and places that at some point could have publicly indexed your last name?”
- 亮点:从互联网数据庞大和模型训练数据多的角度,理性分析Claude写出姓氏可能存在的关联。
- “👀 rustedrobot:Ask it how it knew your last name, something similar happened to me and it pinpointed where it picked it up from.”
- 亮点:提供了一种应对模型写出未提供信息的实用建议。
- “😉 Enough - Meringue4745: Literally every conversation is logged”
- 亮点:指出对话有日志这一事实,可能与隐私问题相关。
- “🤨 gwillen:由于你正在使用API,查看一下对数几率,看看对于这个标记(token)它认为你的姓氏的可能性有多大,也许只是运气好。”
- 亮点:从技术角度给出一种解释这种隐私怪异现象的思路。
情感分析
总体情感倾向是担忧和好奇。主要分歧点在于是否存在隐私问题以及Claude 3.5获取信息的方式。担忧的原因是Claude 3.5在未被提供完整姓名的情况下写出了全名,这可能涉及到隐私泄露;好奇则是因为大家都想知道Claude 3.5到底是如何获取到这些信息的。
趋势与预测
- 新兴话题:Claude是否会像推测的那样存在更多隐私侵犯行为,如Claude 4.0可能会有哪些新的隐私问题。
- 潜在影响:如果这种隐私问题得不到解决,可能会影响用户对Claude以及其他类似AI产品的信任度,进而影响这些产品的使用和推广。
详细内容:
《Claude 3.5 竟知晓我的姓氏,引发隐私担忧》
最近,Reddit 上一则关于 Claude 3.5 的帖子引起了广泛关注。发帖人表示在使用 Claude 3.5 时遭遇了奇怪的经历,让其感到不安。该帖子获得了众多点赞和大量评论。
原帖中,发帖人在让 Claude 3.5 为其项目写 LICENSE 和 README 时,它竟写出了发帖人的全名,而发帖人在此次交流中仅提供了自己的名字。发帖人对此感到困惑,怀疑 Claude 3.5 是否通过过往交互、GitHub 个人资料或其他未曾同意的途径获取了其个人信息。
在众多的讨论中,主要观点如下: 有人认为,互联网信息广泛,可能通过某些关联从公开索引中获取到了发帖人的姓氏。也有人表示,可能是由于发帖人在公共 GitHub 上的存在模式,比如相似的代码结构或评论方式,使得 Claude 3.5 能够推测出其姓氏。还有用户建议直接询问 Claude 3.5 是如何知晓姓氏的。
有人分享自己的经历,如有人的名字也被 Claude 猜测出来。同时,也存在不同的声音,认为这种情况不太可能是因为名字在训练集中,或者质疑公司是否违反了相关数据保护法规。
讨论中的共识是大家都对个人信息在这种情况下被获取感到担忧。特别有见地的观点是,有人指出这可能不仅仅是简单的巧合,而是反映了当前互联网环境下个人信息暴露的问题。
总之,这次关于 Claude 3.5 的讨论让人们更加关注个人信息在人工智能应用中的安全性和隐私保护问题。
感谢您的耐心阅读!来选个表情,或者留个评论吧!