用2396部小电影偷偷训练AI!Meta又摊上大事了,一部罚15万…

快播影视 港台电影 2025-08-30 17:54 1

摘要:最近一家叫Strike3 Holdings的成人电影公司,一纸诉状把Meta告到了旧金山联邦法院,因为一堆小电影的版权问题,轰轰烈烈地对簿公堂。

2396部。

3.59亿美元。

平均每部15万美元。

这串数字,是扎克伯格的Meta,可能要为一批特殊的资料付出的天价学费。

最近一家叫Strike3 Holdings的成人电影公司,一纸诉状把Meta告到了旧金山联邦法院,因为一堆小电影的版权问题,轰轰烈烈地对簿公堂。

那个浓眉大眼的Meta,疑似偷偷下载了他们家的2396部付费成人电影,拿去训练AI模型了!

劲爆的指控

面对这么劲爆的指控,Meta一直都没有回应。

他们可能觉得Strike3就是来碰瓷的,毕竟这家公司在版权诉讼这个赛道上,可是专业的。

刚看到这个新闻的时候,我第一反应是:这Strike3是什么来头?敢跟Meta叫板?

我顺手一查,嚯,发现这家公司不简单。他们可不是什么野鸡草台班子,而是美国成人娱乐界的正规军

旗下有好几个知名品牌,比如Vixen、Tushy什么的,每月网站访客量超过2500万,号称提供的是好莱坞级别的高质量成人电影。

但真正让他们声名远扬的,不是片子拍得多好,而是官司打得有多猛

根据统计,从2017年到2024年,Strike3发起的版权诉讼,超过了两万起!

他们的套路也简单粗暴:广撒网,先用一纸传票把你吓个半死,然后逼你掏钱和解,金额从几百到几千美元不等。

Strike3每年靠着这些和解金,就能轻松入账1500万到2000万美元。也就是说,人家光靠打官司,一年就能赚上亿人民币。

这次盯上Meta这么个大金主,Strike3当然不会手软,直接把价码拉满,开口就是3.59亿美元。

这笔钱,差不多顶得上他们十几年的诉讼KPI了。

你可能会想,Meta这么大个公司,怎么会被抓住把柄?Strike3总不能凭空污人清白吧?

没错,Strike3这次是有备而来,他们提交的证据,把Meta的手法扒了个底朝天。

他们指控Meta从2018年开始,就系统性地利用BitTorrent技术,也就是我们熟悉的BT下载,疯狂盗他们家的付费影片。

Strike3的人顺着这些BT下载的IP地址一查,结果发现在这些下载盗版影片的IP里,至少有47个,是直接注册在Meta公司名下的!

这还没完。更多的IP地址,被Meta藏在了一个叫虚拟私有云的东西里。

简单来说,就是Meta用自己公司的云服务器,建了一个隐蔽的盗播网络,专门用来干这些见不得光的事儿。

更离谱的是,有一个IP地址,甚至追溯到了一个Meta员工的家庭网络上。

文件链接:chatgptiseatingtheworld.com/2025/07/26/strike-3-holdings-sues-meta-for-copyright-infringement-of-adult-videos-including-alleged-use-to-train-ai-model/

Strike3怀疑,这是Meta故意让员工在公司外部进行下载,就是为了躲避追踪。

而且,Meta不只是下载,他们还在持续地做种分享,有的片子一挂就是好几个月。

玩过BT下载的朋友都知道这是什么意思,他们在主动传播,深度参与整个盗版网络的分发和交换。

图个啥?

Meta,一家市值万亿的超级公司,犯得着为了几千部小电影,冒这么大的风险吗?

Strike3在诉状里,给出了两种更靠谱的解释。

第一种解释,是为了当下载货币。

BT下载有个核心机制,叫“tit-for-tat”,翻译过来就是“以牙还牙”。你上传分享得越多,你的下载速度就越快。而成人电影,恰恰是BT平台上最热门、最受欢迎的资源之一。

所以,Meta可能是在有选择地挑片做种。

他们把这些最受欢迎的成人内容当成高速下载券,去换取快速下载其他更庞大、更重要的数据集。

相当于用成人内容当硬通货,来加速自己的数据积累。

第二种解释,就更深层,也更让人不寒而栗了,这些视频本身,就是极佳的AI训练材料。

这些影片,很可能直接被扔进了Meta的AI模型里当养料。

你想想,成人影片里有什么?

有长时间、无遮挡、各种角度的自然人体画面,还有非常独特和极端的人体交互、微表情。

这些素材,在普通的视频网站上是根本找不到的,它们恰好能填补AI训练数据在人类这个主题上的空白。

对于想要生成逼真虚拟人物的AI来说,这些数据简直就是宝藏。

如果这个指控成立,那就意味着,Meta可以借助这些盗版内容,以几乎为零的成本,拥有制造出超高仿真度虚拟成人视频的能力。

这背后的伦理风险和商业价值,都大到难以想象。

更可怕的是,这种行为还可能绕开美国多州对青少年访问成人内容的年龄验证机制,把原本需要付费观看的内容,免费暴露给了未成年人。

你可能会觉得,这事儿听起来怎么这么耳熟?

没错,因为Meta已经不是第一次被抓包了。

就在2023年,一群作家就把Meta告上了法庭,指控他们盗取了海量的盗版电子书。

当时的指控细节,和这次几乎如出一辙,Meta同样是利用虚拟私有云隐藏IP,写自动化脚本,从LibGen、Z-Library这些被称为影子图书馆的网站上,疯狂爬取了81.7TB的盗版电子书,用来训练他们的LLaMA模型。

当时他们就是用虚拟私有云服务器,连接着匿名IP,来掩盖自己的BT下载行为。

不过Meta在那场官司里靠“公平使用”的理由赢了,但从盗版网站获取训练数据这件事,他们是承认了的。

而这一次,Strike3发现,同样的匿名IP,也出现在了他们片源的BT下载群组里。

在Strike3看来,Meta这就是故技重施,把当年偷书的那一套暗箱操作,原封不动地用在了下载小电影上。

干货时间

AI模型的飞速进化,很大程度上,就是建立在吞噬海量数据的基础之上的。

而我们个人也可以通过少量数据训练的LoRA模型,来满足高度自定义生图的需求。

今天的干货时间,就再给大家推荐@Weiibooo的这篇“8 个简易步骤,开启你的 LoRA 模型训练之旅!”

详细讲解如何训练自己的第一款 LoRA 模型,并成功应用到AI创作绘图中。

当然,自己用来训练LoRA模型的数据也需要注意来源合理合规。

现在很多人在学Python爬虫,技术本身没错,但只要行为触碰了这三条高压线之一,就违法了:

1、无视网站的robots.txt协议或用户条款,硬闯禁区。

2、爬取了个人隐私、受版权保护的内容或商业机密数据。

3、请求频率太高,不加节制,像发起了一场DDoS攻击。把人家的服务器搞到瘫痪,影响了网站正常运营。

一句话总结:别硬闯、别乱拿、别搞破坏。

来源:AI观察室

相关推荐