对于病毒这种短小精悍的生物信息载体而言,其中绝大多数序列都应该是具有编码功能的。但是在对SARS的全基因组进行注释的时候,我们发现其包含一段较长的“无用”核苷酸序列:
GUUACUGAGGAUAAAGGUAAGAAAAUA
于是我们对其进行了深入的研究和破译工作。并且把这段序列命名为SEC-1――神秘“基因”一号。
最终,我们成功破译了这段神秘“基因”的含义,原来其中包含了一个签名!
1.按照常规RNA表达的阅读框(3核苷酸)进行分组读取:
GUU.ACU.GAG.GAU.AAA.GGU.AAG.AAA.AUA
2.将AGUC用二进制表示:
A=00
G=01
U=10
C=11
GUUACUGAGGAUAAAGGUAAGAAAAUA
于是我们对其进行了深入的研究和破译工作。并且把这段序列命名为SEC-1――神秘“基因”一号。
最终,我们成功破译了这段神秘“基因”的含义,原来其中包含了一个签名!
1.按照常规RNA表达的阅读框(3核苷酸)进行分组读取:
GUU.ACU.GAG.GAU.AAA.GGU.AAG.AAA.AUA
2.将AGUC用二进制表示:
A=00
G=01
U=10
C=11












