当前位置: 科技先知道 » 人工智能 » Reddit起诉Perplexity:AI数据争夺战升级,内容版权成焦点

Reddit起诉Perplexity:AI数据争夺战升级,内容版权成焦点

社交媒体平台Reddit近日对AI初创公司Perplexity及三家数据抓取服务商提起法律诉讼,指控其通过非法手段获取平台内容用于AI训练。这场诉讼揭示了AI行业对高质量训练数据的激烈竞争,也引发了关于网络内容版权的深度讨论。

根据Reddit提交的诉讼文件,被起诉的三家数据抓取公司分别是SerpApi、Oxylabs和AWMProxy。Reddit首席法务官Ben Lee在声明中将这些公司比作”银行劫匪”,称其”明知无法进入银行金库,就转而攻击运钞车”。Reddit指控这些公司通过伪装身份、隐藏位置等手段,绕过技术防护措施获取平台内容。

诉讼文件显示,Perplexity被指至少使用了其中一家数据抓取公司的服务。Reddit在2024年5月曾向Perplexity发出停止侵权函,要求其停止抓取Reddit数据。虽然Perplexity当时承诺不会使用Reddit内容训练AI模型,但Reddit称此后平台内容在Perplexity中的引用量反而出现增长。

Reddit还进行了一项测试,专门创建了一个仅能被Google抓取的帖子。结果”几小时内”,Perplexity就生成了该帖子的内容。Reddit认为这证明Perplexity通过抓取Google搜索结果获取了其内容。

这场诉讼背后反映的是AI行业对高质量人类生成内容的迫切需求。Reddit作为全球最大的人类对话集合平台之一,其内容对AI模型训练具有重要价值。去年Reddit调整API政策引发用户抗议时,公司就明确表示要从此类数据中获取收益。

目前,Reddit已与OpenAI、Google等AI巨头达成合作协议,但显然希望获得更好的交易条件。此前Reddit也曾对Anthropic采取法律行动,指控其违反承诺访问平台数据。

Perplexity传播主管Jesse Dwyer回应称尚未收到诉讼文件,但强调公司”将始终为用户自由公平获取公共知识的权利而战”,并表示其AI回答服务坚持原则性和负责任的态度。

这起案件不仅关乎两家公司的利益之争,更可能成为界定AI时代内容版权边界的重要判例。随着AI公司对训练数据需求的持续增长,类似的法律纠纷预计还将不断出现。

未经允许不得转载:科技先知道 » Reddit起诉Perplexity:AI数据争夺战升级,内容版权成焦点

相关文章

My title