印度政府近日发布的一份政策文件显示,该国正考虑要求AI公司为训练大模型所使用的内容支付费用,但仅在这些公司开始实现收入之后。这份由印度工业和内部贸易促进部设立的生成式人工智能与版权委员会起草的提案,试图在保护创作者权益与推动AI技术创新之间取得平衡。
混合机制:三项核心安排
面对全球范围内关于AI模型开发者通常未为受版权保护内容付费的持续讨论,该委员会提出了一套包含三个要点的混合方案:
- 一揽子许可机制:AI开发者可通过一揽子许可,合法使用经授权获取的所有内容进行模型训练,无需就每项内容单独协商。
- 商业化后付费:仅当AI工具进入商业化阶段后才需支付版权费用,具体费率将由政府指定的委员会制定,并可接受司法审查。
- 集中式版税管理:建立统一机构负责版权费的收取与分配,旨在降低交易成本、提供法律确定性,并支持各类规模的AI开发者公平获取训练资源。
CRCAT:拟议的版权费征收机构
报告建议设立名为“AI训练版权集体管理组织(CRCAT)”的非营利机构,由版权所有者协会共同组成。同时,该文件提议建立“AI训练版权作品数据库”,欢迎内容创作者登记作品,以获得通过CRCAT获取版权分成的资格。
报告指出,该模式致力于“为AI开发者提供便捷的内容获取途径,简化许可流程,降低交易成本,并保障版权人获得合理补偿”。
印度政府认为,允许免费使用内容的“零成本许可模式”并不可取,因其“可能削弱人类创作的积极性,长期来看导致优质内容产出减少”。
委员会成员也承认,“获取大规模高质量数据对AI发展至关重要”,但他们担心,若就每项内容单独进行许可谈判,可能引发“漫长过程与高昂交易成本,进而阻碍创新,对初创企业及中小微企业尤为不利”。
类似机制在国际上已有先例。多国已设立表演权组织,负责向播放音乐的场所收取版权费并分发给艺术家。新闻转载等领域也存在相应的集体授权安排。
印度的特殊语境与前景
印度的实际情况带来了显著挑战。该国承认22种官方语言,其中8种语言的使用人口超过5000万,媒体与出版生态既庞大又分散。
尽管科技巨头仍在激烈争论是否有权在未事先付费的情况下使用内容训练模型,它们也已开始就日常运营达成若干授权协议。如果新德里能确立合理的版权费标准,这项提案或会受到大型科技公司的欢迎。
印度政府已多次表明其立志在AI各领域成为全球领导者的意图。为实现这一目标,印度对进入本地市场的科技企业总体持开放合作态度。此次提案亦可能为全球AI版权治理提供重要的政策参考。