(接上⽂)
三、《实施细则》第三⼗七条中⼈类遗传资源信息安全审查的范围
《实施细则》第三⼗七条规定的应当进⾏⼈类遗传资源信息安全审查的情形有“(⼀)重要遗传家系的⼈类遗传资源信息;(⼆)特定地区的⼈类遗传资源信息;(三)⼈数⼤于 500 例的外显⼦组测序、基因组测序信息资源;(四)可能影响我国公众健康、国家安全和社会公共利益的其他情形”。
第三⼗七条中的“重要家系”和“特定地区”属于对遗传资源信息来源的规定,⼀般认为“重要家系”和“特定地区”的含义已由《实施细则》第⼆⼗七条明确;第三种情形是对遗传资源信息数量和种类的规定,第四种情形属于兜底条款。然⽽,情形(三)规定的“⼈数⼤于 500 例的外显⼦组测序、基因组测序信息资源”与《实施细则》其他条款对⼈类遗传资源信息的定义以及科技部以往发布的⽂件和通知中对“基因信息”范围的界定并不⼀致。“外显⼦组测序、基因组测序信息资源”应作字⾯解释还是扩⼤解释尚待明确。
《实施细则》第⼆条第⼆款规定“《条例》第⼆条所称⼈类遗传资源信息包括利⽤⼈类遗传资源材料产⽣的⼈类基因、基因组数据等信息资料”,即与第三⼗七条相⽐多了⼀个“等”字,那么此“等”是“等内等”还是“等外等”呢?
我们再来看《实施细则》第⼆条第三款对⼈类遗传资源信息的否定性界定,“前款所称⼈类遗传资源信息不包括临床数据、影像数据、蛋⽩质数据和代谢数据”。根据⽬前⽣命科学的进展现状可知,在排除第⼆条第三款定义的不属于⼈类遗传资源信息的类型后,利⽤⼈类遗传资源材料能获取的信息资料类型多于基因和基因组这两种。另外,科技部在《实施细则》⽣效前发布的《中国⼈类遗传资源国际合作临床试验备案信息表》和《中国⼈类遗传资源信息对外提供或开放使⽤备案信息表》中要求填报的基因数据的种类有 “如全基因组测序、外显⼦组测序、⽬标区域测序、⼈线粒体测序、全基因组甲基化测序、lnc RNA 测序、转录组测序、单细胞转录组测序、small RNA 测序等”。
由此看来,显然《实施细则》第⼆条中的“等”应当属于列举未尽的“等外等”,意即⼈类遗传资源信息不仅包括第三⼗七条规定的外显⼦组测序和基因组测序信息资源,还包括⽬标区域测序、⼈线粒体测序、全基因组甲基化测序、lnc RNA 测序、转录组测序、单细胞转录组测序、small RNA 测序等。此外,《实施细则》征求意⻅稿中的对应条款(第四⼗九条)于“外显⼦组测序、基因组测序”后同样未出现“等”字。因此,笔者认为第三⼗七条与第⼆条相⽐缺少“等”字不是因疏忽⽽造成的⽴法缺陷。
从遗传学技术⻆度看,⽬标区域测序、⼈线粒体测序、全基因组甲基化测序都可以归⼊⼴义的基因组测序;转录组是指在特定的时间和空间内,细胞中所有被转录出来的 RNA 的集合,包括携带外显⼦信息的mRNA 和⾮编码 RNA(non-coding RNA, ncRNA),因此转录组测序、单细胞转录组测序都可以达到获得部分外显⼦组序列数据的⽬的。笔者认为科技部很可能会将《实施细则》第三⼗七条中的“外显⼦组测序、基因组测序”扩⼤解释为还包括⽬标区域测序、⼈线粒体测序、全基因组甲基化测序、转录组测序、单细胞转录组测序。
⽐较麻烦的是 lnc RNA(Long non-coding RNA)和 small RNA(常⻅种类有 microRNA、circRNA、snRNA、snoRNA 等)。lnc RNA 和 small RNA 都属于 ncRNA,它们不编码蛋⽩质的氨基酸序列(虽然部分 lnc RNA指导多肽合成),不属于外显⼦转录本;它们的核酸序列来源于基因组转录,但因为在转录后加⼯成熟过程中经历过剪接、5’端加帽、3’端加尾等处理⽽不能直接对应到基因组序列上;因此不论按照字⾯解释还是扩⼤解释,lnc RNA 测序和 small RNA 测序都难以归⼊外显⼦组或基因组测序。
那么,lnc RNA 测序和 small RNA 测序数据是否应当在⼈数⼤于 500 例时接受安全审查呢?按照《实施细则》⽣效以前的监管⽅式,临床数据、影像数据、蛋⽩质数据和代谢数据亦属于⼈类遗传资源信息,此种管理⽅式⼀直受到医药⾏业的诟病,主要反对理由是这些⽣物表型数据在不同个体之间或在同⼀个体不同的⽣理或病理状态下变化很⼤,不具有稳定性,其医学变化规律的主要动因是治疗⽤的药物、⼿段、⽅式等,⽽不是⼈群或种族基因组差异(但是也不能完全排除基因组个体差异造成的影响),所以难以称得上属于遗传资源信息。
lnc RNA 和 small RNA 在⼈类细胞内主要起到调节 mRNA 剪接、蛋⽩质翻译、染⾊体构象等作⽤。它们在不同组织细胞内或不同细胞状态下的表达谱、表达量变化也⾮常⼤,似乎理应与临床数据、影像数据等⼀样被排除在遗传资源信息之外。
但另⼀⽅⾯,即使经过了⼀些转录后修饰,lnc RNA 和 small RNA 等 ncRNA 毕竟还是经基因组序列转录⽽来的核酸⼤分⼦,在有参考基因组序列的条件下,可以被⽤来检测基因组上对应区域核酸序列的⼈群差异。因此笔者认为,lnc RNA 测序和 small RNA 测序数据如果只涉及 ncRNA 的表达谱和/或表达量,⽽不涉及新发现的 RNA 分⼦序列或新 SNP(Single Nucleotide Polymorphisms)位点,则可能不会受到“500 例”的限制,如果涉及新发现的 RNA 分⼦或 SNP 位点,则在⼤于 500 例时很可能会被科技部以“可能影响我国公众健康、国家安全和社会公共利益的其他情形”为理由进⾏安全审查。
在此建议相关当事⼈在向境外提供或者开放使⽤ ncRNA 测序数据前与监管部⻔进⾏沟通,以是否可能被⽤来发现基因组有关区域的⼈群差异,以及是否可能被⽤来在中国⼈稳定⽣理表型与基因组之间建⽴联系为⽴⾜点,主动说明拟出境数据是否可能影响我国公众健康、国家安全和社会公共利益。
对于兜底情形”可能影响我国公众健康、国家安全和社会公共利益的其他情形”,根据最近的公开案例报道,笔者认为当事⼈特别需要注意以下两⽅⾯⻛险:
⼀、避免我国边疆少数⺠族地区或某些具备特定⺠俗特征的⼈群的⼈类遗传资源信息,被境外研究⼈员以分⼦⼈类学研究为名⽬进⾏不科学的曲解,特别是根据男性 Y 染⾊体单倍体分型、⼥性线粒体基因组测序等数据进⾏的祖源分析或⼈群迁徙历史路线研究。不充分的数据和不科学的数据采集和研究⽅法是分⼦⼈类学研究常⻅的导致错误结论的原因。错误的或故意被曲解的研究结论很可能会被⽤来影响我国⼈⺠内部的⾝份认同、⽂化⼼理认同,⼈为的造成“族群”撕裂,危害国家安全。切断测序数据与“⾝份信息”的联系是⼀种有效的预防⽅法。
⼆、在符合《管理条例》、《实施细则》要求的同时,应当注意不违反《⽹络安全法》、《数据安全法》、《个⼈信息保护法》等与数据安全和个⼈隐私权有关的法规,保证对外提供、开放使⽤的数据不会造成个⼈在教育与就业机会、申请社会救助、保险受惠等⽅⾯遭遇歧视。
四、结语
监管机构在实际⼯作场景下适⽤《实施细则》时肯定会遇到各种各样的问题,尽管被监管者可以等待官⽅的政策解读,但是笔者认为,在充分理解法规并合理的进⾏⻛险⾃评估的基础上,积极主动的与监管部⻔进⾏沟通是更有效的合规动作。对《实施细则》的充分理解离不开总体国家安全观的指引。不论是⼈类遗传资源材料的采集、保藏还是⼈类遗传资源信息的对外提供、开放适⽤,医药机构进⾏⻛险⾃评估时,都需要关注本机构是否已经制定完善的管理制度,采取必要的保密措施,严格遵守伦理规范和尊重受试者的知情同意权。