Meta被指为AI训练下载数十TB盗版电子书,法律风险引关注

   发布时间:2025-02-09 15:13 作者:任飞扬

近日,一名图书作者向法院提起诉讼,矛头直指科技巨头meta,指控其未经授权,擅自下载了海量盗版电子书,用于人工智能模型的训练。

据泄露的内部邮件显示,meta承认曾获取过一个备受争议的大型数据集LibGen,该数据集内含数千万本盗版书籍。这一行为迅速引发了广泛关注和争议。

法庭文件进一步揭露,meta通过一个名为“安娜的档案”的渠道,下载了至少81.7TB的数据,其中来自知名盗版网站Z-Library和LibGen的内容就占据了35.7TB。更令人震惊的是,meta还被指曾从LibGen额外下载了80.6TB的数据。

这位图书作者强调,meta的这一行为不仅构成了非法的电子书库种子下载,而且所揭露的数字可能只是其盗版行为的冰山一角。据作者估算,这些盗版电子书库可能仅占meta盗版版权作品总量的0.008%,暗示其盗版规模可能远超当前已知情况。

邮件内容还透露出meta内部员工对这一行为的法律风险的担忧。2023年4月,meta的研究工程师尼古拉·巴什利科夫在邮件中表示,使用公司笔记本电脑下载BT文件感觉不妥。到了2023年9月,巴什科夫的担忧进一步加剧,他咨询了法律团队,并明确指出,使用Torrents意味着对文件进行“播种”,即对外共享内容,这在法律上是不被允许的。

然而,尽管存在法律风险和内部员工的抗议,meta仍决定继续其下载行为,并试图通过将数据集下载到非meta服务器上来规避被追溯的风险。这一举动无疑加剧了舆论对其盗版行为的质疑和谴责。

此次事件不仅揭示了meta在版权保护方面的严重疏忽,也引发了公众对于科技巨头在数据使用和隐私保护方面的广泛担忧。随着调查的深入,更多关于meta盗版行为的细节或将逐渐浮出水面。

 
 
更多>同类内容
全站最新
热门内容
本栏最新