科学网新冠病毒不是源自实验室
按惯例上来先闲话几句。第一,昨天《中国科学报》,贴出一篇文章《华人学者谈疫情:我希望国家成立专家团来辟谣》,这个想法是好的,但专门成立个什么机构有些小题大做。这段时间大家都蹲在家里不出门,时间有的是,偶尔跳出来发发技术贴搞搞科普并不是多难的事情。第二,前段时间浙大的立铭教授吐槽“简单的生物信息学分析”,今天咱就利用“简单的生物信息学分析”,讨论最近吵的云里雾里的一个问题:新冠病毒究竟是不是源自实验室?
在各种各样的质疑新冠病毒可能源自实验室的文章,水准最高的是美国纯净和应用知识研究所(Institute for Pure and Applied Knowledge, IPAK)的建立者和CEO,Dr. James Lyons-Weiler在网上贴的两篇英文的技术贴,认为2019-nCoV有可能来源于实验室。这些菌株在实验室里连接了通用载体pShuttle-SN,而连接这个载体制备的菌株,主要是为了生产冠状病毒的疫苗。原文链接就不放了,两个帖子的主要内容是,Dr. James Lyons-Weiler将2019-nCoV和其他冠状病毒的基因组序列进行比对,发现2019-nCoV存在一段在其他冠毒里不存在的、长度为1,378 bp的插入片段(INS1378),将这段序列与pShuttle-SN重组载体序列进行比对,有67%的同一性(下图)。
因此,Dr. James Lyons-Weiler的观点是:新冠病毒来自实验室的重组病毒,该重组组病毒主要是为了生产疫苗(A recombined virus made in a laboratory for the purpose of creating a vaccine)。事实上,James并没有实锤他的观点是不是对的,因此他第二篇帖子的题目用了“中等强度的确认”(Moderately Strong Confirmation)。老外写东西,一般正方反方的观点都会列举,他自己总结的支持或反对这个论点的证据如下:
A. 支持的证据:INS1378与pShuttle-SN之间的相似性;存在蝙蝠冠毒中的类SARS的Spike蛋白,或者与冠毒非常相似;自展值低。
B. 反对的证据:低序列相似性(指INS1378与pShuttle-SN之间,但仍然高度显著);这些RNA病毒可能快速演化(例如在实验室条件下)。
C. 观点的可能性:高度可能。
D. 验证:检测中国实验室里的所有在研的冠毒(一例即可证明);在野外分离一个菌株能够与2019-nCoV匹配(一例即可证伪)。
注意Dr. James Lyons-Weiler在(D)里描述的验证方法。事实上要实锤James的观点是正确的,比较困难,因为必须要检测到一株实验室里在研的、用来生产疫苗、并且与2019-nCoV高度相似的病毒菌株。如果找不到这样的菌株,既不能证明James的观点是对,也不能证明他的观点一定是错的。但是James也提出了证伪的方法,那就是找到一株在野外分离的菌株能够与2019-nCoV匹配,这样即可表明他的观点是错的。
================================================
这里我们先讲结论:James的计算分析有误,其结果不能支持新冠病毒源自实验室的猜想。下面我们开始用“简单的生物信息学分析”进行证明:
第一,我们需要先知道冠状病毒的突变速率。查阅文献,2004年Zhao等人发表论文,推测SARS-CoV基因组的突变速率约是0.80 - 2.38 x 10^-3个碱基/位点/年,这个结果与其他RNA病毒有相同的数量级(https://www.ncbi.nlm.nih.gov/pubmed/15222897)。我们考虑上限,一个SARS-CoV基因组的突变率应当不超过3 x 10^-3个碱基/位点/年,2019-nCoV的基因组长度为29,903 bp(https://www.ncbi.nlm.nih.gov/nuccore/NC_045512),这样可以算出来2019-nCoV每年突变的碱基应该<29,903*3x 10^-3=~90 bp。由于计算方法不同,估算出来的突变速率可能不尽相同;病毒基因组的各个部分,可能进化速率也不一致。例如,2004年一篇Science上估算SARS-CoV的突变率为8.26 × 10^–6个碱基/位点/天(https://www.ncbi.nlm.nih.gov/pubmed/14752165),换算得到2019-nCoV每年突变碱基为90 bp(8.26 × 10^–6*365*29,903),与我上面的分析一致。2004年另一篇论文估算SARS-CoV的突变率为5.7 × 10^–6个碱基/位点/天(https://www.ncbi.nlm.nih.gov/pubmed/15347429),换算之后得到2019-nCoV每年突变碱基为62 bp。另外,需要注意的是,目前的分析表明,2019-nCoV的进化速率比较低,有研究者估算2019-nCoV的突变率是2.067×10^-4个碱基/位点/年(),换算之后大约是每年全基因组6个碱基突变,远比我假设的突变率要低。另外,也有学者使用不同的模型,估算2019-nCoV的突变速率约为0.42 x 10^-3 – 1.89 x 10^-3,这个数字也比我使用的要小。因此,我们估算2019-nCoV每年大约突变90个碱基位点,这个数字可以认为是上限。
同类文章排行
- 王健林又悄悄卖了几家万达广场!保险、信托接
- 国产顶级“二次元”IP:三国
- 为什么互联网产品越来越难做了?
- 在人工智能炒热机器人时,也被人把风带进了教
- 刮着大风的人工智能,躺着赚钱的自动驾驶 | 虎
- 珍爱智商,远离“区块链”
- 共享,正从风口到风险
- 智能音箱,正走在智能手表的老路上
- AI在内容分发上的绊脚石
- 为什么大公司的高管们都爱练咏春?