当前位置:首页 > 芯闻号 > 极客网
[导读]纽约州立大学健康科学大学的两位学术作者苏珊娜・马丁内斯-康德与斯蒂芬・麦克尼克,正式对苹果公司发起集体诉讼,指控其旗舰AI系统"苹果智能"(Apple Intelligence)在训练过程中非法使用了包含他们盗版作品的"Books3"数据库。

当地时间10月10日,科技媒体Appleinsider的一则报道揭开了AI行业版权争议的新篇章。纽约州立大学健康科学大学的两位学术作者苏珊娜・马丁内斯-康德与斯蒂芬・麦克尼克,正式对苹果公司发起集体诉讼,指控其旗舰AI系统"苹果智能"(Apple Intelligence)在训练过程中非法使用了包含他们盗版作品的"Books3"数据库。

这场诉讼不仅将苹果推向舆论风口,更再次暴露了全球科技巨头在AI训练数据版权合规上的共性难题,一场围绕"数据合法性"的行业博弈正愈演愈烈。

该案的争议焦点集中在苹果AI训练数据的来源合法性上。原告在诉讼中明确指出,苹果未经授权便利用包含其两部著作《幻觉冠军》(Champions of Illusion)与《思维的诡计》(Sleights of Mind)盗版内容的"Books3"数据库,对"苹果智能"系统进行训练,此举已构成对著作权的严重侵犯。

而支撑这一指控的核心证据链,指向了苹果此前公开的语言模型训练信息。诉讼文件显示,苹果公司在2024年4月承认其在开发OpenELM语言模型时使用了名为"The Pile"的大型数据集,而"The Pile"恰好在当时收录了"Books3"数据库的全部内容。

作为业内知名的"影子图书馆","Books3"曾整合了超过18万本图书的全文资源,一份公开的数据库清单证实,原告的两部学术著作均在其中。尽管"Books3"因持续的版权争议已于2023年10月被强制移除,但原告强调,苹果在数据库存续期间已完成对涉案作品的复制与训练,侵权行为已然成立。

从法律层面看,该案面临双重挑战。一方面,苹果从未公开"苹果智能"训练所用数据的完整文档列表,原告需举证证明苹果确实将涉案书籍用于该系统的训练过程,这一取证过程存在显著难度;另一方面,美国司法系统在AI版权案件中尚未形成统一标准,此前Midjourney等案例的判决倾向于认为,要求AI开发者对海量训练数据进行逐一授权在实操中不具备可行性,这为苹果的辩护提供了参考空间。

科技巨头陷入AI版权纠纷"重灾区"

苹果并非首个因AI训练数据版权问题陷入诉讼的科技巨头。事实上,自生成式AI爆发以来,谷歌、Meta、OpenAI等行业头部企业均已深陷类似纠纷,形成了几大典型争议场景。

场景一:学术与出版内容侵权争议

2023年,美国作家协会联合数千名作者致信谷歌、Meta等公司,指控其未经许可使用文学作品训练AI模型。其中,知名作家尼尔・盖曼与约翰・格里沙姆更是直接参与诉讼,要求Meta赔偿因使用其作品训练LLaMA模型造成的损失。

无独有偶,2024年初,全球最大学术出版商爱思唯尔(Elsevier)对OpenAI提起诉讼,称其未经授权复制了数百万篇学术论文用于GPT系列模型训练,涉嫌侵犯版权及不正当竞争。

场景二:视觉内容的版权博弈

在视觉AI领域,版权纠纷同样激烈。2023年,包括 Getty Images 在内的多家图片机构对Stability AI发起诉讼,指控其使用数百万张受版权保护的图片训练Stable Diffusion模型,且生成的图像存在与原作高度相似的元素。

谷歌也因Imagen模型的训练数据问题遭遇艺术家集体诉讼,原告称谷歌未经许可使用其插画作品,导致AI生成图像对传统创作市场造成冲击。

场景三:"合理使用"的边界之争

Anthropic公司的案例为行业提供了复杂的司法参考。在2024年的一场版权诉讼中,法院虽认定Anthropic使用书籍训练Claude模型的行为符合"合理使用"原则,但同时指出其将侵权书籍长期存储于中央服务器的行为构成违法。这一判决首次在"使用"与"存储"层面做出区分,为后续案件的法律论证提供了新的切入点。

类似地,微软在2025年因Copilot模型使用新闻内容训练,被多家媒体集团起诉,核心争议点也集中在"合理使用"的界定与商业利益分配上。

AI数据合规的探索破局

面对持续升级的版权诉讼,科技巨头们开始探索数据合规的解决方案。一方面,部分企业选择与内容方达成合作协议,比如谷歌于2024年与新闻集团签署为期三年的合作协议,获得其新闻内容的AI训练授权;Meta则与多家出版社建立"数据授权联盟",通过付费方式获取合法的图书资源。

另一方面,行业内兴起"合规数据集"的开发热潮,例如亚马逊推出的"Clean Crawl"数据集,仅收录明确授权的公开内容;谷歌则研发了"版权过滤引擎",在训练前对数据进行版权风险筛查。

从法律框架来看,各国也在加速AI版权规则的制定。欧盟《人工智能法案》明确要求AI开发者披露训练数据的来源,并确保数据获取的合法性;美国版权局则在2025年发布《AI生成内容版权指南》,试图厘清AI训练与版权保护的边界。这些举措虽为行业提供了方向,但在实操层面,如何平衡创新效率与版权保护,仍是科技巨头们需要长期面对的课题。

回到苹果的这场诉讼,其结果不仅将影响涉案双方的权益,更可能成为AI行业版权认定的关键判例。当AI技术的发展越来越依赖海量数据的支撑,"数据合法"已不再是可选项,而是决定企业能否持续发展的核心竞争力。在这场关乎创新边界与版权保护的博弈中,科技巨头们需要拿出更具建设性的解决方案,而非被动应对诉讼。毕竟,真正的AI革命,应当建立在尊重知识产权的基础之上。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭