Reddit起诉Perplexity：AI数据争夺战升级，内容版权成焦点

社交媒体平台Reddit近日对AI初创公司Perplexity及三家数据抓取服务商提起法律诉讼，指控其通过非法手段获取平台内容用于AI训练。这场诉讼揭示了AI行业对高质量训练数据的激烈竞争，也引发了关于网络内容版权的深度讨论。

根据Reddit提交的诉讼文件，被起诉的三家数据抓取公司分别是SerpApi、Oxylabs和AWMProxy。Reddit首席法务官Ben Lee在声明中将这些公司比作”银行劫匪”，称其”明知无法进入银行金库，就转而攻击运钞车”。Reddit指控这些公司通过伪装身份、隐藏位置等手段，绕过技术防护措施获取平台内容。

诉讼文件显示，Perplexity被指至少使用了其中一家数据抓取公司的服务。Reddit在2024年5月曾向Perplexity发出停止侵权函，要求其停止抓取Reddit数据。虽然Perplexity当时承诺不会使用Reddit内容训练AI模型，但Reddit称此后平台内容在Perplexity中的引用量反而出现增长。

Reddit还进行了一项测试，专门创建了一个仅能被Google抓取的帖子。结果”几小时内”，Perplexity就生成了该帖子的内容。Reddit认为这证明Perplexity通过抓取Google搜索结果获取了其内容。

这场诉讼背后反映的是AI行业对高质量人类生成内容的迫切需求。Reddit作为全球最大的人类对话集合平台之一，其内容对AI模型训练具有重要价值。去年Reddit调整API政策引发用户抗议时，公司就明确表示要从此类数据中获取收益。

目前，Reddit已与OpenAI、Google等AI巨头达成合作协议，但显然希望获得更好的交易条件。此前Reddit也曾对Anthropic采取法律行动，指控其违反承诺访问平台数据。

Perplexity传播主管Jesse Dwyer回应称尚未收到诉讼文件，但强调公司”将始终为用户自由公平获取公共知识的权利而战”，并表示其AI回答服务坚持原则性和负责任的态度。

这起案件不仅关乎两家公司的利益之争，更可能成为界定AI时代内容版权边界的重要判例。随着AI公司对训练数据需求的持续增长，类似的法律纠纷预计还将不断出现。

Reddit起诉Perplexity：AI数据争夺战升级，内容版权成焦点

相关文章

近期热门