Getty Images首席执行官里希?苏纳克(Rishi Sunak)表示,他需要决定是支持英国的创意产业,还是将一切押在人工智能的繁荣上。
自2019年以来一直领导该图像库的克雷格·彼得斯(Craig Peters)发表讲话之际,创意和媒体部门对收集图像库的材料用于人工智能公司的“训练数据”越来越愤怒。他的公司正在英国和美国起诉多家人工智能图像生成器侵犯版权。
“当我观察英国时,可能有10%的GDP来自创意产业,无论是电影、音乐还是电视。我认为这种权衡是有风险的。如果我是英国人,押注于人工智能,如今英国国内生产总值不到四分之一,远远低于创意产业,这是一个令人困惑的权衡。”
2023年,作为对知识产权局咨询的回应,政府制定了“克服人工智能公司和用户目前在使用受版权保护的材料方面面临的障碍”的目标,并承诺支持人工智能公司“将受版权保护的作品作为其模型的输入”。
这已经是较早前一项针对文本和数据挖掘的广泛版权例外的提议后退了一步。英国世袭贵族、负责人工智能和知识产权事务的议会副国务卿卡姆罗斯子爵(Viscount Camrose)周四在对下议院一个委员会的回应中表示:“我们将对提出的问题采取平衡和务实的态度,这有助于确保英国在人工智能领域的世界领先地位,同时支持我们蓬勃发展的创意产业。”
受版权保护的作品在人工智能训练中的作用面临越来越大的压力。在美国,《纽约时报》正在起诉ChatGPT的制造商OpenAI和微软,称其将新闻报道作为其人工智能系统训练数据的一部分。尽管OpenAI从未透露它使用了哪些数据来训练GPT4,但《纽约时报》能够让该人工智能系统逐字引用《纽约时报》的文章。
OpenAI在一份法庭文件中表示,如果不使用受版权保护的材料,就不可能构建人工智能系统。该组织补充说:“将训练数据限制在一个多世纪前创作的公共领域书籍和图纸上,可能会产生一个有趣的实验,但无法提供满足当今公民需求的人工智能系统。”
彼得斯不同意。Getty Images与Nvidia合作创建了自己的图像生成AI,专门针对授权图像进行培训。“我认为,我们的合作伙伴关系完全反驳了一些观点,即你不能拥有这些技术而需要许可证。我完全不这么认为。你需要采取不同的策略,不同的方法,但没有能力做到这一点的想法只是烟雾。”
即使在行业内部,潮流也在转变。一个名为Books3的盗版电子书数据集由一个人工智能组织托管,该组织的版权删除政策一度是一个视频,一个穿着衣服的女人在唱歌时假装手淫她们想象的阴茎。在其中包含的作者强烈抗议后,该数据集被悄悄从下载中删除——但在此之前,它被用来训练meta的LLaMa AI等。
除了盖蒂(Getty)和《纽约时报》(New York Times)提起的诉讼外,针对人工智能公司的其他一系列法律诉讼也在进行中,原因是它们的训练数据可能存在侵权行为。
约翰·格里沙姆(John Grisham)、乔迪·皮考特(Jodi Picoult)和乔治·RR·马丁(George RR Martin)等17位作家在9月份起诉OpenAI,指控其“大规模系统性盗窃”,而一群艺术家在去年1月对两家图像生成器提起诉讼,这是此类案件首次进入美国法律体系。
最终,法院甚至政府如何决定规范使用受版权保护的材料来训练人工智能系统,可能不是这个问题的最终定论。许多人工智能模型,包括文本生成法学硕士和图像生成器,已经“开源”发布,可以免费下载、共享和重用,而不受任何监督。禁止使用受版权保护的材料来训练新系统不会从互联网上清除这些东西,也不会阻止个人在未来使用新材料来重新训练、改进和重新发布它们。
彼得斯乐观地认为,选举结果并非板上钉钉。他说:“那些制作和分发代码的人,他们最终都有法律实体,他们要受法律约束。你在笔记本电脑或手机上运行的内容可能是一个更大的问题,但这是个人责任。”