OpenAI在不断拓展技术边界的同时,AI涉及的版权归属再起争端。
2023年12月,《纽约时报》状告OpenAI版权侵权。2024年1月,非虚构作者群体发起同样的诉讼。在积极应对的同时,OpenAI加快了与多家内容出版商讨论授权许可。
内容出版商与大模型技术公司的纠纷愈演愈烈,而压力已经来到各国版权局。过去一年,头部科技公司与版权局积极沟通,电厂在翻阅相关文件发现,大模型带来的版权问题不比技术本身容易理清,且与探索大模型落地应用的公司和个人息息相关。
版权问题可以被粗略地分解到两个环节,大模型训练输入和大模型创作输出。输入环节的纠纷是掌握版权和掌握技术的头部力量“神仙打架”,输出环节的纠纷往往是与个体相关的“人间真实”:利用大模型创作的作品是否应该受到版权保护,以及版权应该归谁?
根据国内外现有的诉讼案例,最常被想到的判决结果都出现过,版权归创作者个人、归大模型(即无法授予版权)、归训练大模型的一方。
相异的判定结果
大模型输出的文字、图片、视频三类内容当中,图片内容的版权纠纷在目前是最复杂的。由于生成式视频技术还难以输出具备作品价值的内容,暂时没有可参考的案例出现。对待生成式文字、图片内容,不同国家的态度各不相同。
早在2020年,腾讯公司发起的一起诉讼中,法庭判定AI软件Dreamwriter生成的作品具有版权。由于AI不是自然人和法人,因此版权归软件开发公司腾讯所有。
另外在2023年11月27日判决的国内“AI文生图*案”中,原告使用AI软件Stable Diffusion创作的作品被被告挪用,法院判决被告侵权。在有关报道中,主审法官称考虑了案件对(AI)产业的影响。可以预见,短期国内有关使用AI生成的内容能够得到法律保护,未经授权的情况下使用这些内容可能构成侵权,权利方归软件使用者所有。
在这起案件中,原告多次向AI软件输入提示词调整输出结果,这一过程被法庭认为表现出了对作品的构思编排,因此图片构成一件作品,AI软件的角色仅是创作作品的工具。
然而,类似的情况在美国可能截然不同。著名的AI画作《空间歌剧院》尝试了624个提示词,耗时80多个小时制作,并且在艺术竞赛中夺得头奖,结果被美国版权局(USCO)拒绝签署版权。
USCO对AI画作一直持否定态度,从2022年至今四次拒*AI画作签署版权。电厂在翻阅USCO给部分申请人的回函中发现,USCO确定版权时要求作品必须是人类作者创作,必须具备创造力。USCO对作品的创造力有*限度的要求,且强调这个要求“可能只有一点点”。因为作者无法控制或预测AI生成作品的结果,USCO认为就版权目的而言,在AI软件提示词方面的工作,仅凭“一点点”的提示,就得到一个复杂的输出,这个过程中缺乏人类的作者身份。
生成式AI技术普及之后,USCO接收到大量有关版权的申请和问询,于是在2023年3月16日发布了一份AI生成内容的版权注册指南。指南列出了几条要点,比如“版权只能保护人类创造力产物的材料”,“焦点在于AI内容来自于‘机械复制’,还是作者自己的心智构思及其表达”。
这些要点强调了作品的“人类作者身份”,把由AI创作的内容排除在外。AI作画需要人来输入提示词,但人在其中并不构成作者身份,而是基于数据训练的“机械复制”。如果AI生成的作品中有足够证据证明“人类作者身份”的参与,那么版权将仅保护该作品的人类创作部分。比如漫画《黎明查莉娅》中,图画部分使用AI创作,USCO拒*此授权,但单独对作者写的文字剧情签署版权。
可以看到,版权授予的过程中存在一些模糊的标准,USCO引用了首例照片诉讼案进一步明确立场。
1884年,美国最高法院裁决照片作品《奥斯卡·王尔德第18号》可以受到版权保护,因为它们“代表了作者原创的智力概念”。这一案件将版权保护范围首次扩大到摄影。当时反驳的观点认为,照片仅是“某些自然物体或某人的精确特征在纸上的复制品”。但最高法院强调,如果一张照片仅是一个“机械复制”的过程,“没有人类摄影师的新颖性、发明性或*性”,那么“在这种情况下,就不受版权保护”。
USCO暗示,人通过AI输出内容,这个过程中缺少“新颖性、发明性或*性”,并进一步举例称“猴子拍摄的照片无法被授予版权”,版权只保护人类创作的作品。不过,USCO并没有进一步讨论AI生成作品的作者是不是AI,这可能将版权的受益方导向AI开发商。
科技公司的不同态度
2023年8月,USCO就AI版权问题公开征求意见,多家提供AI服务的科技公司参与其中。电厂发现,各个公司对待AI作品的版权主张也不相同。
Adobe发布了生成式图片大模型Adobe Firefly,并公开保证训练数据完全合规。即便如此,Adobe仍然主张AI输出内容不受版权保护。Adobe认为用户输入的提示词仅仅代表用户的想法,Al通过解释这些提示输出了内容。换句话说,是AI创造了关于这些想法的表达,而不是人类。不过,随着多模态技术应用,如果用户将自己的作品作为提示输入,那么输出的内容应该受到版权保护。
持类似观点的还有谷歌和OpenAI。双方都认为现有的版权法足以解决AI作品的授权问题,没有理由将版权保护扩大到AI生成的作品。OpenAI还强调,生成式AI技术还在快速发展,会刺激创意产业实践快速变化,目前尝试制定有针对性的解决方案还为时过早。同时,OpenAI不对其生成式AI产品的输出主张任何所有权。
三家巨头的观点并非无迹可寻。Adobe的数据显示,Firefly大模型一个月产生了10亿张图片。如果这些图片获得版权许可,Adobe建立的版权商业将受到冲击。谷歌和OpenAI则希望规避法律风险的同时,不希望有太多针对AI的法规出台。
然而微软有不同意见,它呼吁版权保护使用AI的创作者。与OpenAI不同之处在于,微软提供了众多AI应用,并直接服务用户的工作和商业活动。微软把大模型比作人类创作作品的助手和工具,强调人类控制着创作过程并决定最终的创作。
微软用代码生成模型GitHub Copilot举例。GitHub Copilot用户所编写的代码行数占比越来越高,今年年初为46%,微软预计未来几年将增至80%。微软称,Copilot使开发人员能够专注于创造过程,而不是搜索文档和案例。开发者还因此可以控制整个开发过程,比如程序的结构、提示Copilot提出建议、迭代编辑建议。微软认为如果没有版权的保证,使用AI工具制作的作品的商业可行性就会受到损害。
确权为时尚早
AI作品能不能得到版权保护,除了法律技术方面,还有一些待解决的问题。
在输入端,大模型训练数据的版权纠纷尚未明确,那么就版权确认而言,输出端的内容合法性就存在质疑。这种情况下,面对大量的申请需求,USCO拒绝授权的态度就理所应当了。
生成式图片软件Midjourney创始人David Holz在接收《福布斯》采访时公开承认,训练Midjourney所用的图片没有获得原作者的许可。他表示,“确实没有办法获得一亿张图像并知道它们来自哪里。如果图像中嵌入了有关版权所有者的元数据,那就太酷了,但没有这种东西。”
由于没有相关的判决,David Holz因此可以公开表达并暂时无责。OpenAI对此则更加谨慎,在给相关机构的意见中,OpenAI认为对于眼下这种不明确的局面,“OpenAI和其他人工智能开发商面临着巨大的法律不确定性和合规成本。”
电厂了解到,版权赋权要考量合法性,也要考量权责关系。这可能也是科技公司主张AI作品不受版权保护的原因之一。具体来说,商业公司创造和编程了工具,用户仅输入提示词,如果AI生成的内容侵犯版权,应当由哪一方承担责任?
输出端内容的侵权问题是提供AI服务和工具的商业公司考量的重点之一,在这一问题上与所服务的用户“相爱相杀”。
一方面,为了打消用户顾虑,谷歌、微软、OpenAI、Adobe等都曾宣布,将承担客户因生成式内容而产生的诉讼和赔偿费用,并提供法律支持。这些服务主要面向企业客户,微软特别强调“客户必须实施我们提供的必需防护措施和缓解措施,才有资格获得所承诺的服务”。
另一方面,类似于社交媒体公司规定的,用户在社交网络上的账号归社交网络运营商所有。OpenAI在ChatGPT的《使用条款》中明确,用户使用ChatGPT输出的内容属于OpenAI转让的权益,并支持用户在遵守一系列条约的情况下使用。如果用户非法使用,OpenAI可以追责。而Midjourney的类似规定仅针对付费用户,非付费用户不被允许商业使用。
在给USCO的回复意见中,几家科技公司进一步表态,认为如果AI生成作品存在侵权,原因通常是在用户的提示下发产生的。微软称“用户必须按照设计负责任地使用这些工具”,OpenAI建议“评估与AI输出相关的侵权索赔时应该从用户开始,毕竟,没有用户的提示就没有输出,并且输出的性质直接受到提示的影响。”
据了解,大模型训练通常使用元提示(meta-prompt)、分类器(Classifier)等技术调整输出结果,从而减少有害内容。科技公司认为这些措施已经极大避免了可能存在的侵权。
欧盟版《人工智能法案》在2023年12月出炉,被认为是全球首部指导人工智能全面监管的法案。相关分析认为,美国类似的法案出台之前,USCO在版权问题的坚持对于科技公司来说不是好的信号。
版权问题的“拖延”也在限制大模型技术的能力,OpenAI提到,与版权所有者进行合作可以获取其他方式无法访问的材料,“并以超出预期的方式显示它们”。可以预见,大模型能力的后续迭代与酝酿中的法案息息相关。