律政思|生成式人工智能时代下,香港需要怎样的《版权条例》?
来稿作者:邓凯
围绕人工智能与法律及其业界关系的探索展开,2024年无疑是香港科技法律和法律科技的“大年”。1月,香港律师会代表法律实务界别率先表态,以发布立场文件的形式申明应对技术变革的行动纲领。7月初,特区政府推动公众咨询,就《版权条例》如何保障人工智能技术发展研究立法修订。同月底,司法机构政务处公布司法人员使用生成式人工智能的一般规则和基本原则,司法界采取何等价值立场与技术趋势进行妥当相处就此明确。立法、司法以及法律服务界“三箭齐发”,共同构筑起香港“科技—法律”关系持续演化的制度框架,故而值得严谨剖析。本系列文分上下两个篇章,上文著重人工智能立法及其背后的法理探讨,特别是在香港《版权条例》修订的知识产权语境之中如何演绎;下文则聚焦法律人工智能,旨在通过解构法律人工智能的核心原理,正本清源地剖析法律业的应用实践与未来机遇。
和众多领域一样,法律业无疑是受眼下大模型技术浪潮冲击较大的社会子系统。一方面,人工智能已然在法律实践领域中展现巨大的应用潜力,并试图重塑行业内的工作方式。另一方面,实定法制度、数字法法理也需要对技术的客观演化做出有效回应。而在法律体系内部,被誉为“技术之子”的版权法则是最敏感的法律学科,不论是涉及司法诉讼抑或是相关立法检讨,生成式人工智能的版权保护、侵权认定、风险防范等重点关切的厘清,都取决于知识产权法治如何破题。
本人与合作者曾在〈香港如何应对生成式人工智能的版权法挑战〉(《大公报》法政新思栏目2023年6月8日刊载)一文中指出,生成式人工智能会诱发传统版权制度消亡。这绝非危言耸听,二者间的拉扯和张力首先表现在内容创造在版权领域内的底层逻辑遭遇重塑,人工智能在思想的具体表达层面正逐步赶超人类对创作行为的一贯垄断。该现象的侧面则是,鉴于人工智能慧生成内容的效率远超人类,这使得传统版权法对于自然人主体的坚守,以及“只保护自然人创作”的制度基石产生动摇。进一步推演,版权法“授权—许可”模式的可适用性,连同“接触+实质性相似”的侵权规则在很大程度上也会被大模型训练的技术模式所架空,等等。
相信上述版权法新现象是香港此次检讨《版权条例》修订的初衷。尽管该条例于2022年新修完毕并在次年5月生效实施,并侧重在数字化环境中加强版权保护,但彼时之修订并没有预见此番生成式人工智能技术浪潮的“骤然”来临,故而未能及时纳入立法者应对当前挑战的价值判断。在社会新瞩目下,立法会就完善《版权条例》推动新一轮公众咨询应当视为又一次与时俱进的制度因应和法律补强,具有极强的现实性和必要性,本文即源于此展开。
一、版权是否存在于人工智能创作的作品?
从文本上看,关于“版权与人工智能”公众咨询文件的整体叙事逻辑,主要围绕“人工智能生成作品的可版权性”、“侵权责任”以及“特定豁免的拟制”这三个方面展开。首先是关于人工智能生成作品是否应获得版权法保护,这在法理上似乎是一个应然性的思辨论题,依托不同理论支撑的各国法律实践对此存有分歧。多数国家原则上不为人工智能生成物提供法律承认,它们受康德式的“主客体统一认识论”和“人是目的”哲学观点的支配,恪守“工具论”,也即人工智能通常被视为人类实现特定目的的工具或称作用对象,只适格担任版权法法律关系中的客体,其生成物自然无法享受版权法保护。秉持这一严格取态的典型司法管辖区包括澳大利亚、加拿大、中国内地、欧盟、新加坡以及美国(咨询文件也做了列举),例如美国版权局在被誉为“生成式人工智能元年”的2023年就数次撤销或驳回了使用Midjourney生成画作的版权申请。“工具论”的正当性毋庸置疑,其作为经典的科技法治理念,在维护知识产权体系的稳定性以及捍卫人类中心主义的作者权等价值面向上能形成显著的正向激励。
另一种作品可版权类型则不拘泥于仅对自然人作者加以保护,以英国、新西兰、香港等司法管辖区为代表。这些法域对作品的认定采用了以独创性结果为核心的“结果主义”范式,只要特定作品能满足原创性并以表现为某种形式的智力成果就可获得承认,而不必纠结作品是否必须由人类创作。例如,“由电脑生成的作品”早在英国《1988年版权设计和专利法》(CDPA)中就被正式纳入权利范畴,并设置有50年的保护期限。根据相关立法资料披露,香港的立法者于1993年进行版权法律改革时,亦同意上述英国取向并跟随其做法,创立了自己的电脑生成作品条款且延续至今。
也因此,现时香港版权法可以相容人工智能创造物的法律确认。三十年前的版权法改革“正中今日技术之下怀”,意外成就了一番符合眼下发展利益的法制巧合:按照咨询文件所述,“现行《版权条例》事实上已包含适用于为人工智能生成作品提供版权保护的所需条文””。当人们还在思量人工智能生成物可版权性的“应然性”问题时,香港现行法制已供给了“实然性”保障,其不仅在法律形式外观上甚为超前,更有助于带来制度激励和竞争优势。至少英国当年在CDPA中承认人工智能(电脑)的作者主体地位,根源在于希冀借这一法律创新或称权利拟制促成激励,使本国在全球资讯技术竞争秩序中扮演更重要的角色。香港的动机也异曲同工,有英国CDPA的影子,咨询文件对此坦言到:“早于1997年前订立的电脑产生作品条文中采用的概括性表述——‘电脑产生’,足以灵活应对日新月异的科技发展……(也)足以涵盖在没有人类作者,但可以确定作出所需安排的人的身份的情况下由电脑产生的作品……(此举)旨在回馈为创造电脑产生文艺作品致力作出所需安排的人,并向他们提供经济诱因,以及与本港版权制度鼓励创意和其他投资的整体目标一致。”
二、如何推演版权侵权风险与责任分配?
除却人工智能生成物的可版权性论争外,大模型或触发的版权法律争端则主要集中在生成式人工智能的训练和应用两个阶段,各国对此均有典型侵权诉讼案件发生,受到各界高度关注。关于前者即大模型在训练阶段易于引发侵权纠纷,其根源在于生成式人工智能的形成和优化依赖于大量的数据训练,而用于训练的数据往往包含受版权法保护的诸多内容。例如在全球首例“Stable Diffusion”演算法模型版权侵权案中,原告就把标的模型定义为“一个复杂的拼贴工具”:“(它)将无数受版权保护的图像存储和合并为训练图像后……生成完全基于训练图像的‘新’图像……(而被告)从使用受版权保护的图像中获得商业利益和丰厚利润。”
总体来看,大模型训练的核心技术原理是将资料库中的作品数据进行某种形式的转换后输入模型,利用模型自主学习能力从中提取有价值的内容,再根据输入的指令生成与之相匹配的学习结果加以输出。在此训练过程中,大模型对版权作品的主要利用行为涉及“复制”与“改编”,法律争议与侵权风险即源于此。
进入到内容输出阶段,或称人工智能生成应用阶段,当中的侵权风险则更多地附著在大模型用户对生成内容的后续传播利用上。一方面,有观点认为生成式人工智能输出的内容会侵犯版权是极小概率的事件,这是大模型的技术机制所决定的。具言之,大模型每一次输出的内容都是根据模型权重、提示词和随机种子的组合重新生成的,多重因变数作用下的生成结果势必存在较大差异,特别是随著演算法不断调优与训练数据集的倍数增加,单个版权作品的价值将不断被“稀释”,生成结果的侵权概率微乎其微。 版权作品价值被“冲淡”的另外一面是“接触”行为作为“实质性相似”前提的侵权测试逐步失灵。囿于生成式人工智能的非外显机制,版权人实际无法或极难发现模型内部的作品利用行为——类似于链条被切断导致因果关系难以判定——从而致使侵权举证不能。以上诱因不仅造成了大模型厂商(研发者)与使用者之间出现权责分界,也使内容生成及应用阶段的侵权风险被动地向传播环节的下游转移,更多地落入资讯传播权的规制范畴,如由深度合成(伪造)招致的各类法律责任并为传统的内容监管覆盖。
不难发现,生成式人工智能的版权侵权责任结构异常复杂,其中既有阶段之分,又有风险主体之别,各法域对此并无法律改革或规则创制的基本共识,更遑论对各自现行版权法律作出调整。这一现实背景下,咨询文件务实地诉诸于各平等主体间基于意思自治的合约安排,提出以市场手段解决人工智能生成作品所引发的归责与风险分配问题,而非贸然创设刚性法律规定。本港立法者充分恪守“有所不为”或称“刻意无为”的大智慧,其背后蕴含了精妙而深刻的普通法法理:“……人工智能慧生成作品的侵权相关法律责任问题取决于就每个个案进行必要的调查后所得的事实和支持证据……如一刀切硬性规定法律责任特定由某人(例如人工智能系统的拥有人及/或最终使用者)承担,将无法顾及每宗侵权个案独有的实际情况,从而牺牲不同情况下的公平性。”咨询文件进一步强调,需维持现行《版权条例》中相关条文的概括性、广泛性和科技中立性,以确保既有法制始终具有持续演化、应对挑战的空间。 如此取态无疑是各类市场创新主体和相关持份者的最大定心丸。
三、为合理使用作为版权豁免而辩护
咨询文件的包容性与创新性还体现在通过设置特定的豁免机制对现有版权法系统进行补足。咨询文件总体上允许大模型在开发、应用时可以宽泛合理地使用版权作品,为的是拓展人工智能产业发展,维持香港竞争力。事实上,大模型构成“合理使用”免责的主张在全球范围内颇有市场,包括欧盟、日本、新加坡以及英国都已引入版权豁免规则,倾向于认可生成式人工智能享有合理使用版权作品的正当性,文本及数据利用的豁免不同程度地适用在商业和(或)非商业用途。美国更是鼓励作品二次利用的代表性国家,在合理使用的认定标准上一贯较其他法域更为灵活开放,至少结合过往司法实践来看,假若美国法院不鲜明地支持版权制度里的合理使用,包括生成式人工智能在内的一系列数字经济创新就不可能在该国率先发生。
传统授权许可机制的固有缺陷也是证立合理使用版权豁免的关键理据。这是因为,生成式人工智能的技术提升必须以海量的数据供给为前提,面对纷繁复杂的版权形态、权利归属,如若在获取与利用版权作品过程中仍因循守旧地奉协商授权为基本原则,以付费许可为事前要件,非但违背了大模型内容生产模式本身之规律,更会降低模型训练/投产速度,牺牲技术演进所需的效率价值。当中徒增合规成本,也将诱发抑制创新的“寒蝉效应”。因而,合理使用之版权豁免应当视为对授权模式适用乏力的制度性“代偿”,其“先斩后奏”的特质在某种程度上为促进人工智能生产力效益所必须。诚然,为平衡这一豁免的恣意性,搭建行之有效的作品退出管道(opt-out)并为版权人设定权利保留的法律安排也要纳入立法议程,尤其要凸显对版权人知情权、选择权等朴素法益的支持与维护。
在技术手段上,在版权合理使用与权利保护之间取得恰当平衡这一治理目标似乎有机会通过开展人工智能生成内容标识工作(AI标识)的方式实现。大模型厂商从提升透明度与权利保障强度等角度出发,正在探索AI标识路径,特别是就版权作品的使用,采用显式或隐式的标注示明其内容性质来源,在便利权利人主张权益的同时,更能激励社会大众利用新科技工具进行内容创作。 在该意义上,AI标识或许还隐喻出自然人类创造与人工智能生成的边界在不断模糊与反复厘清之间尽力做出技术表达,并给予立法者以启迪:大模型治理应以体现激励相容与价值共益作为基本共识,一个理想又浪漫的法律秩序必然是包括原始版权所有人、人工智能厂商以及AI增强型创作者等攸关方都能赢取合规激励,使人工智能内容创作尽可能地从由道德迷思与伦理诘问带来的哲学式“纠缠”中脱困出来。
四、代结论:创造“多劳多得”的法律激励
不可否认,关于人工智能的一系列制度性思辨都掣肘在其主体性上。仅就版权规则创制而言,尽管香港《版权条例》以一种似是而非的“模糊立法”范式变相地赋予了生成式人工智能以适格创作者的主体身份(至少在法律外观采取了“拟制作者”的进路),但实践效果成疑,有待在真实发生的司法裁断中做出进一步适用与澄清。以上文提及的英国CDPA为例,该法的“电脑生成作品”条款看似首屈一指,实则早已休眠沉寂,仅在2006年于英国衡平法院有过一次饱受争议的裁决。究其原因,有分析指出了该制度存在的消极性与被动性:为防止作品被认定为“电脑生成作品”,在版权法上遭受权利范围受限和保护期限“歧视”,创作者不得不选择隐瞒相关事实。这种负面激励在生成式人工智能的香港版权语境中亦有机会发生,值得关注深省。
生成式人工智能的法律实践方兴未艾,也伴随其理论底座正悄然变迁。相较于文章开头处论及的人工智能“工具论”与版权保护的“结果主义”,“贡献论”在业界的认受度则愈来愈强,这显然根植于生成式人工智能生产内容的人机交互与来回问答的产品技术模式。当生成式人工智能从单纯的辅助工具转变为与人类思维伴生的紧密合作伙伴,但又远不足以担任具有自主意志的创造替代者之时,形式主义的工具论和绩优主义的结果论这二者的解释力就难以为继。“贡献论”中的“贡献”内涵指代的是人类具有独创性的过程控制。例如,《欧盟人工智能白皮书(2020》要求人工智能版权作品需体现人类意志的控制作用;再如内地《人工智能慧法(学者建议稿)》也在激励人类的智力付出与劳动成本出,强调作品性应“根据使用者对内容最终呈现的贡献程度”进行判明。
立法之外,各国法院也在向版权新领域探究,并试图在诸多悬而未决的问题中为人类贡献作答,为人之禀赋呐喊,这何尝不是来自司法界的实证主义法律激励。正如在标志性的美国Thaler v. Perlmutter案中,裁决者就陈述了人工输入比重对人工智能可版权的决定性价值;以及在中国内地的“文生图”首案里,主审法官毫不掩饰人类个性化表达的关键性,“AI使用者在提示词部分进行的回馈式修正,其体现了原告的审美选择和个性判断”。令人惊喜地是,香港法院守卫“多劳多得”人类价值的思考则早已暗含在2007年Tai Shing Diary Ltd v. Maersk Hong Kong Ltd案的“汗水原则”(sweat and brow)叙事中:“只要(人类)作者在创作过程中或多或少投入了精力,又或运用过相关技巧及判断即可;除非付出劳力过少被视为纯机械式活动。受版权保护的不只是展示作品所运用的技巧和付出的努力,还包括在收集、筛选、编排及以易于理解的方式呈现现有资料所投入的技巧和精力。”由此带来的法律激励恰巧契合于当下现实,即人类在向机器提示指令(prompts)时的创作与智力劳动也有机会被推定为原创,相应获得可确权的法律空间。引申而来的“残忍事实”或在于,包括法律在内的各色职业,在生成式人工智能时代都将面临其能否进化为“提示词工程师”(法律知识工程师)之合格角色的灵魂拷问。这既是本文的初步收尾,又是下编严谨论及法律职业与法律科技之间关系的发端。
作者邓凯是香港城市大学法律学院公法与人权论坛研究员、法学博士。文章仅代表作者个人观点,不代表香港01立场。
“01论坛”欢迎投稿,来函请电邮至01view@hk01.com。来稿请附上作者真实姓名及联络方法。若不适用,恕不通知。