2025年以来,为了解决大模型全球部署集约化以及境内算力资源紧俏的问题,一种看似两全其美的方案,在跨国公司中被频繁提及——存算跨境分离部署。即:将大模型本体及推理环境(计算层)部署在境外,而将应用层(例如APP、Agent等)及存储层(例如用户数据、企业知识库等)部署在境内合规数据中心。
很多技术团队认为,“既然用户数据存储境内,且传输过程加密,只要境外不存储用户数据,就不算数据出境吧?”“大模型部署在境外云算力上,不用遵守中国相关法律规定吧?”
汇业律师事务所黄春林律师团队认为,该架构在工程层面似乎解决了算力集约化与数据本地化的矛盾,但在法律层面还是绕不开数据出境和在中国境内提供大模型服务的法律实质。具体分析如下,仅供参考。
一、 架构拆解:什么是存算跨境分离
在典型大模型部署架构中,存、算虽然会隔离,但一般都是在同一个法域环境下,例如都部署在阿里云、火山引擎等境内合规环境。而本文提及的“存算跨境分离”架构,则实现了存、算跨法域分离,即:
二、 存算跨境分离架构下的数据境外旅程透视
在该架构下,尽管用户数据在旅程终点回流境内,但因为大模型本体及算力环境部署在境外,因此,用户数据不可避免地会在物理意义上被传输到境外,具体包括如下几个方面:
三、 Tokenization 和加密传输
是否影响法律定性
1. 大模型的 Tokenization 并非匿名化措施
在大模型语境下,单纯的Tokenization不等于法律上的匿名化,Token化的prompt等数据依然属于个人信息。虽然Token化后看起来是一串数字(如[234,102,55]),但只要结合公开的转换算法,就能直接识别出自然人身份。这种识别成本极低,甚至不需要“额外信息”,因此它依然属于个人信息。因为,token化后:
此外,大模型的Token化和安全领域的Token化完全不是一个概念,前者是模型分词,法律意义上属于明文数据;后者是安全令牌化,法律上可以达到去标识化效果(但也仍然属于个人信息)。
2. 加密通道不改变用户数据向境外传输的物理属性
法律层面上,加密通道(如TLS1.3、VPN)是安全保护措施,但没有改变用户数据向境外传输的物理属性。加密解决的是“传输安全”问题,而合规解决的是“边界控制”问题。即使通道是密封的,数据旅程只要经过境外(详见第二部分),数据主权就面临落入他国管辖的风险。在中国数据出境申报实践中,数据传输方式(公网传输还是专线传输)本来就是申报的标准事项之一。
四、 中国法律关于数据出境行为的判断标准
《个人信息保护法》《数据安全法》《数据出境安全评估申报指南(第三版)》等采取了“行为主义”原则,即只要具有“将在境内运营中收集和产生的数据传输至境外”的行为,不问“数据是否在境外落地存储”的结果,都视为发生了中国法意义下的数据出境行为。
同时,《数据出境安全评估申报指南(第三版)》等进一步明确,即便具有“数据存储在境内”这一结果,只要境外具有了“可以查询、调取、下载、导出”的行为可能,也属于中国法意义下的数据出境行为。
此外,《个人信息保护法》第4条关于“个人信息处理”的定义,明确涵盖“存储、使用、加工、传输”等行为形态。如第二部分分析,用户数据在境外云算力中心的下列处理行为,属于中国法律项下的个人信息处理行为:
五、 境外分离部署大模型仍应遵守国内法约束
在存算分离模式中,境外大模型并非简单的基础技术设施或软件服务,而是以API、接口或推理服务的形式,持续、稳定地向境内输出AI服务结果。在法律评价上,这一模式往往同时具备以下特征:
因此,在此情形下,境外大模型的角色已明显超出“技术支持” “软件服务”的范畴,而属于向中国境内提供人工智能服务(具体服务形态根据大模型类型而定)。因此,一旦被认定为境外大模型向境内提供人工智能服务,境外部署大模型仍应遵守国内法包括但不限于如下约束:信息安全相关义务;算法、模型相关的合规责任;服务主体合法性与产品备案合规;等等。
六、 结语
相较于其他部署模式,存算跨境分离模式的风险概览如下:

综上,在中国现行法律与监管框架下,这种存算跨境分离的大模型部署模式,并非一条“中性技术路径”,而是一种法律风险高度集中的部署模式。其核心问题在于,无论数据是否境外落盘、是否加密、是否经专线传输,相关行为均可能同时触发数据出境合规义务与服务提供合规风险。
因此,企业在相关架构设计阶段,即应从整体合规视角进行系统评估,而非仅就单一技术要素作切割式判断。大模型的存算跨境分离是技术对国际化的妥协,技术能解决数据的“归属”问题,但解决不了数据和服务的“旅程”问题。只要旅程跨越了法域边界,法律上“数据出境” “AI服务”的合规问题就无法妥协。

上一篇:2025年度国家安全十大热词盘点
下一篇:该文章已是最后的一篇