近年来,人工智能(AI)技术的浪潮席卷全球,其中生成式AI的崛起尤为引人注目。然而,伴随技术飞速发展而来的,是围绕版权保护的诸多法律争议。AI模型训练需要海量数据,而这些数据往往包含受著作权保护的作品,这使得AI训练过程中的版权问题日益凸显。如何界定AI训练中对版权作品的使用是否构成侵权?“合理使用”原则在AI训练中的适用范围又该如何界定?这些问题已经成为全球法律界高度关注的焦点。在这场旷日持久的辩论中,美国和中国这两个AI技术发展的重要国家,已经分别作出了初步的司法判决,但其截然不同的结论,预示着一场关于AI与版权的终极对决已经拉开帷幕。

这场对决的核心,在于对“合理使用”原则的解读和适用。在美国,版权法第107条规定了合理使用的四个考量因素:使用的目的和性质、受版权保护作品的性质、使用量和作品整体的实质性部分、以及使用对潜在市场或价值的影响。AI训练是否符合这些因素,成为了美国法院需要仔细权衡的关键。

美国司法实践中的分歧

美国在AI版权领域的司法实践,呈现出一种复杂且充满矛盾的状态。最初,北加利福尼亚地区法院在安德里亚·巴茨等作家起诉Anthropic的案件中,裁决受版权保护的作品用于AI训练属于合理使用。这一判决一度被视为为AI开发者提供了一定的法律空间,仿佛打开了潘多拉魔盒,为大规模的数据抓取和模型训练铺平了道路。然而,随后的汤森路透诉罗斯案的判决,却给这一趋势踩下了刹车。特拉华州联邦地区法院认定罗斯公司未经授权使用汤森路透的法律数据库内容训练AI工具构成版权侵权,且不属于合理使用。这一判决不仅明确指出AI模型训练过程中存在侵犯著作权的复制行为,还直接否定了合理使用的抗辩,无疑给快速发展的AI行业泼了一盆冷水。

汤森路透诉罗斯案的特殊性在于,原被告双方存在直接的商业竞争关系。汤森路透作为全球领先的法律信息服务商,其Westlaw数据库拥有海量且经过专业整理的法律数据,其市场地位难以撼动。而罗斯智能则是一家致力于开发基于AI的法律检索搜索引擎的新兴公司,目标直指法律信息检索市场。法院在判决中强调,罗斯公司利用汤森路透的版权内容来训练AI模型,旨在与Westlaw竞争,这种使用具有明显的商业目的,且对Westlaw的潜在市场造成了影响,因此不符合合理使用的标准。这一判决清晰地表明,在存在直接竞争关系的情况下,法院更倾向于保护版权所有者的权益,避免市场竞争的失衡。

诉讼浪潮与未竟之局

除了上述案件,围绕AI版权的诉讼浪潮还在持续涌动。《纽约时报》对OpenAI和微软的诉讼,以及音乐出版商对Anthropic的指控,进一步加剧了AI版权争议。这些诉讼不仅要求AI公司销毁使用未经授权内容训练的模型,还涉及巨额的赔偿要求,其最终判决结果将对整个AI行业的未来发展方向产生深远影响。这些案件的共同点在于,原告方认为AI公司未经许可使用了其大量受版权保护的作品,直接侵犯了其著作权。虽然加州法院驳回了音乐出版商对Anthropic的初步禁令请求,允许其继续使用歌曲歌词训练AI模型,但案件仍在继续审理中,最终结果仍然充满不确定性。加州法院对GitHub Copilot的版权诉讼的决定,则为使用版权数据的AI工具提供了一定的保护,避免了未来的法律纠纷。这些案件表明,美国法院对于AI训练数据版权的看法并非一成不变,而是在个案中进行具体分析和权衡,试图在版权保护和技术创新之间找到平衡点。

中国的平衡之道

与美国不同,中国在AI训练数据版权问题上的司法实践相对谨慎。通常情况下,中国法院不会仅凭AI的输出结果反推训练过程中的侵权行为,而是要求原告对被告在AI模型训练中使用了其受著作权保护的作品进行单独举证。这一举证责任的分配,无疑增加了原告维权的难度。2024年底,杭州中院在“奥特曼”案中,维持了一审判决中数据训练使用他人作品构成合理使用的认定,并对AI生成内容侵权行为的防范义务进行了强调。这一判决表明,中国法院在AI训练数据版权问题上,更倾向于平衡AI技术发展与版权保护之间的关系,鼓励技术创新,同时也强调AI开发者在使用数据时的合规义务。

中美两国法院在AI数据训练使用他人作品问题上作出的相反判决,反映了不同法律体系和价值取向的差异。美国法院在判决中更加注重合理使用原则的适用,旨在鼓励AI技术的创新发展,甚至在一定程度上容忍了版权的让渡。而中国法院则更加注重保护版权所有者的权益,强调AI开发者在数据使用过程中的合规义务,防止出现大规模的侵权行为。这场关于AI与版权的对决,远未结束。随着AI技术的不断发展,相关的法律问题也将日益复杂。如何制定更加明确和完善的法律法规,平衡AI技术发展与版权保护之间的关系,将是未来面临的重要挑战。各国需要在实践中不断探索,共同构建一个既能鼓励创新,又能保护知识产权的AI发展新生态。