作者:赵宇先丨叶志豪丨陆利锋
引言
在以大语言模型(LLM)、生成式人工智能(Generative AI)和多模态算法为核心的新一轮技术革命中,算力、算法与数据构成了驱动全球数字经济增长的三大核心要素。随着各类人工智能底层大模型及垂直行业应用的爆发,围绕数据许可、算力租赁、模型定制开发、开源协议遵守以及顶尖技术人才流动引发的纠纷也日趋频繁。这些高度复杂的技术与商业互动,催生了大量复杂的合同纠纷。商事仲裁是处理这类合同纠纷常用的争议解决机制之一。
然而,人工智能行业的合同纠纷呈现出标的虚拟化、损害后果不可逆化、电子证据极易灭失等有别于传统实体行业的显著特征。旧《仲裁法》因缺乏明确的“证据保全”和“行为保全”落地制度,在解决这类纠纷时暴露出了明显的短板。
2026年3月1日,新修订的《中华人民共和国仲裁法》(以下简称“新《仲裁法》”)正式施行。新法在保全制度上实现了里程碑意义的突破:第三十九条明确将“责令作出一定行为或者禁止作出一定行为(即行为保全)”纳入仲裁保全的法定范围,第五十八条完善了证据保全制度,在立法层面确立了人民法院对行为和证据保全申请的“及时处理”义务。
在这一背景下,本文旨在讨论人工智能行业合同纠纷的典型场景与核心痛点,并结合境外司法实践,探讨新《仲裁法》完善的仲裁前及仲裁中行为保全与证据保全制度对处理人工智能行业合同纠纷的重要实践意义。
一、人工智能行业合同纠纷的特征 — 证据灭失风险与救济的紧迫性
AI技术的研发与商业化部署,通常涉及极为庞杂的数据供应链、重资产的算力租赁集群、高度定制化的算法开发服务以及极度稀缺的科研人才网络。这些环节的任何一个所引发的合同纠纷,通常具有区别于传统行业合同的相关特征。
(一) 人工智能行业的核心合同纠纷类型
根据我们的实践经验和观察,人工智能行业的合同纠纷主要集中在以下四大核心领域:
1. 数据许可、爬取边界与知识产权授权纠纷
数据是训练生成式人工智能模型的“燃料”与“血液”。在实践中,数据的所有权、使用权、许可边界以及衍生模型权重的归属,往往是争议的高发地。在合同纠纷方面,常见的纠纷场景如下:
违反平台服务条款与越权爬取引发的违约纠纷:为了获取海量的训练语料,许多AI开发者广泛使用自动化网络爬虫技术从公共网站获取结构化或非结构化数据。这一行为极易违反目标网站的用户协议或API使用限制。例如,全球知名在线社区Reddit针对某知名AI大模型公司提起诉讼,指控其绕过Reddit的官方授权许可程序,在未支付任何商业补偿的情况下抓取用户生成内容用于大模型训练,严重违反了平台的用户协议[1]。
特定数据商业许可的“越界”使用:企业间常常签订数据共享、数据库采购或特定授权协议。然而,被授权方可能会超出合同约定的使用范围,将这些高价值的私有数据用于训练其专有的基础大模型。在某公司数据许可纠纷案中,原告主张被告违反了合同约定,将原告的专有数据库用于被告自己的AI应用训练[2]。
2. AI软件/算法定制开发与项目交付纠纷
传统企业在进行智能化转型时,往往会将AI系统的开发、垂直行业大模型的微调(Fine-tuning)外包给专业的AI公司或技术供应商。此类技术开发合同或IT基础设施合同的纠纷,通常表现为迟延交付、系统性能严重不达标(例如模型的“幻觉率”过高、准确度未达到合同强制要求)或项目资金链断裂导致的烂尾。
当开发合同因一方声称的根本违约而面临提前终止时,委托方通常急迫地希望能够获取已经开发完成的半成品源代码、模型权重或经过清洗标注的专有训练数据集,以便止损并交由第三方继续开发。如果开发方以未结清尾款为由行使抗辩权,拒绝交付核心代码并直接切断云端系统访问权限,甚至威胁要删除相关数据,将导致委托方的整个智能化业务瞬间停摆,前期的巨额投资也将化为乌有。
3. 算力租赁与基础设施服务合同纠纷
大语言模型的预训练(Pre-training)需要消耗极其惊人的算力资源,通常依赖于由数万张高端GPU(如Nvidia H100)组成的庞大算力集群。常见的纠纷场景包括:算力提供方未能保障承诺的网络带宽或算力稳定性(频繁的服务器宕机或节点故障会导致长达数月的训练进度中断,损失呈指数级放大);或者,承租方因融资不畅未能按期支付高昂的GPU租金,导致算力提供方依据合同发出终止通知,威胁切断集群网络,甚至直接删除已保存在服务器内存或硬盘上的极具价值的数据。
4. 保密协议、竞业限制与核心人才流动纠纷
人工智能行业的技术壁垒与核心竞争力,在很大程度上高度凝结在少数顶尖的算法科学家、数据工程师和底层架构研究人员身上。当掌握核心模型架构设计、独特训练方法或高价值客户名单的关键员工跳槽至直接竞争对手时,原雇主往往面临技术路线被迅速复刻的紧迫危险。相关跳槽行为可能会违反劳动合同、离职协议或相关合同中的竞业限制条款和商业保密条款。在技术迭代以“周”为单位计算的AI赛道,如果不能在员工入职竞对的第一时间予以阻止,原雇主可能会丧失市场领先地位和先发优势。
(二) AI合同纠纷当事人对“证据保全”和“行为保全”的迫切需求
人工智能领域合同纠纷之所以有别于传统行业的许多合同纠纷,其根本原因在于技术运作的底层逻辑决定了违约与相关后果具有很强的瞬时性与不可逆性。正是这些特征,当事人在通过商事仲裁寻求救济时,对仲裁前或仲裁中的“证据保全”和“行为保全”具有相当紧迫的需求。具体原因如下:
1. 由“机器遗忘(Machine Unlearning)”的难度导致的违约后果的不可逆性
在传统的违约案件中,法院或仲裁庭事后判决停止相关违约行为或赔偿损失,往往能够在较大程度上使受害方恢复原状。但在生成式AI的语境下,如果一方违约使用了另一方的高价值专有数据进行大语言模型训练,这些数据一旦进入训练管道,经过复杂计算,就会被彻底打碎并转化为神经网络中数十亿甚至数万亿个不可读的权重参数(Weights)和偏置(Biases)。
从目前的计算机科学前沿技术来看,学术界和工业界尚无法完美实现精确的“机器遗忘(Machine Unlearning)” — 即在不严重损害模型整体泛化能力和性能的前提下,将特定数据的影响从已经训练好的模型中完全、精准地剥离、清洗掉。(就跟人很难完全忘记自己见过或学过的东西一样。)因此,一旦包含受害方机密商业数据或版权数据的模型训练完成并被打包部署,损害即刻固化,且在物理与数学意义上无法逆转。这就使得受害方在寻求救济时,存在一个紧迫的程序需求:必须在违规数据被输入模型训练之前,或者在训练过程刚刚启动之时,通过法律强制手段(如行为保全)强行中止违约方的行为。
2. 算法系统的“黑盒效应”导致的电子证据的极度易失性
AI系统的开发与训练过程,高度依赖于分布式的服务器日志、API调用记录、临时缓存的训练数据集清洗版本以及超参数配置文件。这些电子数据天然具有极易被覆盖、篡改或一键删除的特性。尤其是,AI训练过程中产生的中间状态数据(如训练快照、梯度日志)极少被长期保存,一旦训练任务结束或服务器资源被回收,相关记录往往永久消失。
当合同纠纷爆发时,如果受害方不能在第一时间通过证据保全程序保护相关数据的原始状态,后续长达一两年的仲裁庭审可能会陷入举证不能的被动局面。
二、旧《仲裁法》的缺失与新《仲裁法》的突破
(一) 旧《仲裁法》体系下的保全困境
在1995年颁布并长期适用的旧《仲裁法》体系下,中国仲裁的保全制度主要聚焦于传统的“财产保全”,而对于非金钱给付类纠纷最为迫切需要的“行为保全”,法律并未作出明确的授权性规定。尽管修订后的《中华人民共和国民事诉讼法》第一百零三条明确规定了人民法院可以作出行为保全裁定,但在仲裁实务中,由于旧《仲裁法》第二十八条等相关条款仅明文规定了当事人可以申请“财产保全”,许多地方法院在面对国内仲裁或涉外仲裁当事人提交的仲裁前或仲裁中行为保全申请时,往往直接裁定不予受理或驳回申请。
证据保全方面,尽管旧《仲裁法》第四十六条规定当事人在特定情况下有权申请“证据保全”,但由于缺乏新法下的“人民法院应当依法及时处理”的表述,当事人在仲裁中申请“证据保全”鲜有被法院支持。
此外,由于旧法未在成文法层面正式承认仲裁庭作出的临时措施的法律地位,尽管境内各个主要仲裁机构的规则都配备了“紧急仲裁员(Emergency Arbitrator)”程序,但当事人通过该等程序获得的临时禁令(有的效果类似于行为保全或证据保全)在境内执行缺乏法律基础。换言之,当事人不太可能通过申请该等临时禁令在大陆境内解决前述提及的紧迫问题。
(二) 新《仲裁法》的核心突破
2026年3月1日全面施行的新《仲裁法》,或可很好地回应前述AI合同纠纷解决的实务痛点。新法在保全制度上的革新与破局,可以概括为以下几个方面:
关于行为保全:新《仲裁法》第三十九条明确规定:“一方当事人因另一方当事人的行为或者其他原因,可能使裁决难以执行或者造成当事人其他损害的,可以申请财产保全、请求责令另一方当事人作出一定行为或者禁止其作出一定行为。当事人申请保全的,仲裁机构应当将当事人的申请依照《中华人民共和国民事诉讼法》的有关规定提交人民法院,人民法院应当依法及时处理。因情况紧急,仲裁协议的当事人可以在申请仲裁前依照《中华人民共和国民事诉讼法》的有关规定向人民法院申请财产保全、请求责令另一方当事人作出一定行为或者禁止其作出一定行为。当事人申请保全的,人民法院应当依法及时处理”。
关于证据保全:新《仲裁法》第五十八条明确规定:“在证据可能灭失或者以后难以取得的情况下,当事人可以申请证据保全。当事人申请证据保全的,仲裁机构应当将当事人的申请提交证据所在地的基层人民法院,人民法院应当依法及时处理。因情况紧急,仲裁协议的当事人可以在申请仲裁前依照《中华人民共和国民事诉讼法》的有关规定向人民法院申请证据保全。当事人申请证据保全的,人民法院应当依法及时处理”。
“人民法院应当依法及时处理”的表述使得法院有义务回应当事人的行为保全申请,并在符合规定的情况下作出保全裁定。关于“及时”的含义,新《仲裁法》并未明确规定,尚待司法解释。但是,结合《民事诉讼法》第一百零四条,理论上可以尝试理解为人民法院在接受此类紧急申请后,必须在四十八小时内作出裁定;裁定采取保全措施的,应当立即开始执行。
新《仲裁法》的前述规定,对于及时阻断跳槽员工泄露数据、AI模型的数据污染、防止关键算法源码被销毁,可能具有决定生死的实务意义。当然,由于新法刚刚施行,后续落地及实际效果尚待观察。下文介绍的域外相关实践(不限于合同纠纷)或可提供一定的参考。
三、“行为保全”与“证据保全”类似救济的域外实践
中国法律体系下的“行为保全”和“证据保全”在效果上类似于境外法律体系中的初步禁令(Preliminary Injunction)或临时救济(Interim Relief)。本节将参考境外相关司法经验,探讨在AI纠纷中,当事人可以如何利用相关救济维护自身利益。
值得注意的是,在境外法律体系中,责令对方禁止或采取某种行为的临时禁令的申请门槛通常非常高,当事人往往需要在胜诉可能性、救济紧迫性、损失不可逆、双方利益平衡等方面进行充分举证。在新《仲裁法》施行后,中国法院将采取何种审查门槛,还有待实践观察。
(一) 及时阻断违规数据训练流水线与模型的大规模部署
当一家科技企业发现其耗费巨资清洗、标注的独家授权数据,被违约方秘密输入到某个正在训练的基础大模型中时,其最首要的诉求通常不是漫长仲裁后的金钱赔偿,而是要求对方立刻停止服务器上的训练进程。
例如,在印度首例AI训练数据版权侵权案中,某印度知名新闻机构不仅主张某AI大模型公司未经许可复制并使用其版权新闻内容训练大模型,构成传统版权侵权,更进一步强调该AI公司在没有任何许可协议或商业补偿的情况下,利用公开可访问但具有显著商业价值的新闻材料进行训练,导致模型产生严重幻觉(Hallucination),并涉嫌将捏造的新闻故事错误归因于该新闻机构,从而损害其品牌声誉并可能助长误信息传播。基于上述指控,新闻机构向德里高等法院请求颁发禁令(Injunction),禁止AI公司继续存储、使用或通过大模型访问/生成基于其版权内容的响应,并要求删除已存储的相关数据,以防止其专有内容被进一步用作AI模型的训练语料[3]。
(二) 防范核心算法泄漏与阻击商业秘密的流失
AI行业的人才争夺战已进入白热化阶段。掌握核心多模态算法架构或关键工程优化路径的核心员工,一旦携带机密代码跳槽至竞争对手处,往往会对原雇主造成致命打击。此时,原雇主紧急申请相关禁令,通过法院禁令直接禁止前员工在竞对公司入职或开展同类底层架构研发,有些时候是挽救原雇主产品生命的唯一有效手段。
在新加坡高等法院审理的[2024] SGHC 29一案中,某科技公司前高级高管离职后迅速加入竞争对手,负责竞争对手相关业务。原雇主以该高管违反相关合同中的竞业限制条款为由提起诉讼,并紧急申请临时禁令,旨在阻止该高管为竞争对手履职;备选方案为寻求“跳板禁令(Springboard Injunction)”,禁止该高管接受任何原雇主竞争对手的雇佣。
法院严格适用普通法系的“American Cyanamid测试”决定是否颁发临时禁令:
1. 是否存在需要实质审理的严重问题(serious question to be tried):法院重点审查非竞争条款是否保护合法专有利益(如客户联系、机密信息),以及条款在范围、地理和期限上是否合理。
2. 便利平衡原则(balance of convenience):即使假设存在严重问题,法院仍需权衡错误颁发禁令对被告(职业自由中断、潜在长期失业)的损害,与错误不颁发对原告(潜在机密泄露)的损害孰轻孰重。
最终,在严格适用前述标准后,法院驳回原雇主的临时禁令申请(包括跳板禁令)[4]。
该案提示,在申请行为保全时,申请人应当特别注重举证其合法利益受侵害的具体性,以及条款合理性的充分论证,方能提高获批概率。
(三) 强制违约方交付相关数据和材料
除了“禁止不为”,行为保全的另一面是“责令作出一定行为”。在AI系统定制开发、垂直模型微调外包等IT服务合同因违约而终止时,强制开发商立即向委托方交付已完成阶段的源代码、模型权重参数及技术配置文档,往往至关重要。
在EWHC 144(TCC)一案中,原告以被告交付严重迟延、软件存在多项根本性缺陷为由,终止了双方签订的定制争议解决软件平台开发合同(Software Development Agreement)。为避免项目进一步停滞并尽快转交新承包商继续开发,原告在实体诉讼正式启动前,向英国技术与建设法院(TCC)紧急申请强制性临时禁令(Mandatory Interim Injunction),要求被告立即交付迄今开发的所有软件、源代码、测试规范、测试结果、底层架构配置记录等。
然而,这一看似合理的商业诉求未能得到法官支持。法官指出,要求当事人改变现状、积极履行某种具有不可逆性质交付行为的“强制性禁令”,在司法审查的门槛上要远远高于仅仅要求其维持现状的“禁止性禁令”。如果法院在实体争议未决的情况下,错误地颁发了强制禁令导致源代码提前泄露给第三方接盘方,被告的核心知识产权和议价筹码将受到不可挽回的毁灭性损害;反之,原告即便现在不能立刻获得代码,其因项目停滞遭受的损失最终也是可以通过量化的金钱赔偿来弥补的。因此,法院认为不宜支持“强制性禁令”[5]。
该案揭示了强制性保全与禁止性保全之间的关键差异 — 要求对方积极交付某物件的强制性保全,在证明“不可挽回损害”及“便利平衡”方面门槛更高。在中国法律框架下申请类似的行为保全时,申请人应当充分准备相关材料以证明其紧迫性和不可替代性。
四、新《仲裁法》施行后的实务建议
面对新《仲裁法》赋予的前述制度红利,在合同谈判、履行和纠纷解决过程中,AI公司和相关从业人员可以参考如下实务建议:
1. 细化违约责任条款相关表述:为便于法院理解相关违约行为特征及其救济的紧迫性,可以考虑在“违约责任与救济”章节中,前置性地写明类似如下的特殊约定:“双方明确同意并确认,一旦发生本协议定义之特定严重违约行为(例如:越权或违规爬取原始数据、超范围滥用底层算法源码、违反开源限制),守约方将面临无法用金钱计算且不可弥补之商业损害。在此情况下,守约方有权在提起正式仲裁前或仲裁过程中,直接向有管辖权的人民法院申请行为保全和/或证据保全。违约方在此不可撤销地自愿放弃抗辩该等损害可通过事后金钱赔偿予以充分救济的权利”。
2. 建立并保存完整的数字资产存证链条:AI合同项目启动后,建议公司从第一天起就有意识地建立系统化的电子存证机制。具体而言,可考虑定期对核心训练数据的哈希值(Hash Value)进行公证或在区块链平台存证;对关键技术文档、版本迭代记录及API调用日志定期进行可信时间戳认证。一旦纠纷发生,上述存证材料将成为向法院申请证据保全或在仲裁庭出示数据归属与版本状态的直接依据,有效降低“举证不能”的风险。
3. 在合同中预设数据访问权与审计权条款:建议在合作合同中明确约定,在特定触发事件发生时(如付款争议、项目延期超过约定天数),守约方有权委托独立第三方技术机构对另一方服务器上与合同相关的训练数据、模型权重及使用日志进行现场审计或镜像复制。此类条款一旦落入合同,不仅可在纠纷发生时大幅压缩对方的举证对抗空间,更能在诉前直接为证据保全申请提供有力的合同依据。
4. 制定纠纷爆发后的“前72小时”应急响应预案:AI合同纠纷的核心伤害往往在纠纷爆发后的前几天内即已发生或固化。建议AI企业提前制定并定期演练应急响应预案,明确内部技术团队、法务团队与外部律师的协作分工,确保在纠纷爆发后的72小时内完成:(1)关键证据的紧急固证;(2)向有管辖权法院提交仲裁前保全申请的材料准备;(3)内部准备好申请仲裁的初步材料。
结语
在算法迭代以周为单位、数据资产转瞬即逝的AI时代,法律救济的时效性已与技术本身的竞争性深度绑定。新《仲裁法》将行为保全与证据保全明确纳入仲裁制度框架,并对人民法院施加“及时处理”义务,是立法层面对AI时代商事纠纷特殊性的一次正面回应,为AI企业通过仲裁机制维护核心权益提供了更为有力的制度保障。
当然,制度层面的突破仅是起点。如何将法律文本转化为案件中实际可执行的保护,取决于合同谈判阶段的前瞻性布局、日常运营中的证据管理意识,以及纠纷爆发时的快速反应能力,后续尚待各方从业者积极探讨实践。
特别声明 |
|
汉坤律师事务所编写《汉坤法律评述》的目的仅为帮助客户及时了解中国或其他相关司法管辖区法律及实务的最新动态和发展,仅供参考,不应被视为任何意义上的法律意见或法律依据。 如您对本期《汉坤法律评述》内容有任何问题或建议,请与汉坤律师事务所以下人员联系: |
|
赵宇先 电话: +86 21 6080 0272 |
|
叶志豪 电话: +86 21 6080 0568 Email:zhihao.ye@hankunlaw.com |
|
陆利锋 电话: +86 21 6080 0216 Email:lifeng.lu@hankunlaw.com |
[1] Reddit sues AI startup Anthropic for allegedly using data without permission, Reuters,https://www.reuters.com/business/reddit-sues-ai-startup-anthropic-allegedly-using-data-without-permission-2025-06-04/(访问时间:2026年3月1日)。
[2] Clio's Fastcase sues rival legal tech firm Alexi, Reuters,https://www.reuters.com/legal/litigation/clios-fastcase-sues-rival-legal-tech-firm-alexi-2025-12-01/(访问时间:2026年3月1日)。
[3] Generative AI and Copyright Issues Globally: ANI Media v OpenAI, Tech Policy,https://www.techpolicy.press/generative-ai-and-copyright-issues-globally-ani-media-v-openai/(访问时间:2026年3月1日)。
[4] Shopee Singapore Pte Ltd v. Lim Teck Yong, [2024] SGHC 29,https://www.elitigation.sg/gd/s/2024_SGHC_29(访问时间:2026年3月1日)。
[5] TRANSPARENTLY LIMITED v. GROWTH CAPITAL VENTURES LIMITED, EWHC 144 (TCC),https://www.bailii.org/ew/cases/EWHC/TCC/2022/144.html(访问时间:2026年3月1日)。