DNA各种序列格式介绍

时间:2024.4.1

DNA各种序列格式介绍

20xx年12月18日 ? Genomics ? 字号 小 中 大 ? 暂无评论 ? 阅读 510 次

[点击加入在线收藏夹] 1.Plain格式 A sequence in plain format may contain only IUPAC characters and spaces (no numbers!).

Note: A file in plain sequence format may only contain one sequence, while most other formats accept several sequences in one file. An example sequence in plain format is:

ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGC CCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGA CTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGC AAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCG CTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCAT TTTAATTACAGACCTGAA Plain sequence序列格式,只含有IUPAC字符和空格,不含有数字,并且一个Plain格式的文件只能含有一条序列。 2.EMBL格式 A sequence file in EMBL format can contain several sequences.

One sequence entry starts with an identifier line (“ID”), followed by further annotation lines. The start of the sequence is marked by a line starting with “SQ” and the end of the sequence is marked by two slashes (“//”). An example sequence in EMBL format is:

ID AB000263 standard; RNA; PRI; 368 BP.

XX

AC AB000263;

XX

DE Homo sapiens mRNA for prepro cortistatin like peptide, complete cds. XX

SQ Sequence 368 BP; acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg 60 ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg

caggaagcgg 120

caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag

tggacctccc 180 aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg

cggcaggaag 240 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac

ttcttctgga 300

agaccttctc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag

tttaattaca 360

gacctgaa 368

// EMBL格式文件可以包含多条序列,每个序列条目都以”ID”开始,紧跟一些注释信息,序列的开始标记为”SQ”,结束标记为”//”。

3.FASTA格式

A sequence file in FASTA format can contain several sequences.

Each sequence in FASTA format begins with a single-line description, followed by lines of sequence data.The description line must begin with a greater-than (“>”) symbol in the first column.

An example sequence in FASTA format is:

>AB000263 |acc=AB000263|descr=Homo sapiens mRNA

ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCC

CCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGAA

CTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCC

AAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGC

CTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATG

TTTAATTACAGACCTGAA

FASTA格式文件可以包含多条序列,每条序列之前都有以”>”开始的一行,该行包含一些序列的描述信息。

4.GCG格式

A sequence file in GCG format contains exactly one sequence, begins with annotation lines and the start of the sequence is marked by a line ending with two dot (“..”) characters. This line also contains the sequence identifier, the sequence length and a checksum. This format should only be used if the file was created with the GCG package.

An example sequence in GCG format is:

ID AB000263 standard; RNA; PRI; 368 BP.

XX

AC AB000263;

XX

DE Homo sapiens mRNA for prepro cortistatin like peptide, complete cds. XX

SQ Sequence 368 BP;

AB000263 Length: 368 Check: 4514 .. 1 acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg 61 ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg caggaagcgg 121 caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag tggacctccc 181 aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg cggcaggaag 241 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac ttcttctgga 301 agaccttctc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag tttaattaca 361 gacctgaa

GCG格式文件只含有一条序列,以一些注释信息行开始,序列以”..”行开始,该行还包含序列的标识,以及长度等。 5.GenBank格式 A sequence file in GenBank format can contain several sequences.

One sequence in GenBank format starts with a line containing the word LOCUS and a number of annotation lines. The start of the sequence is marked by a line containing “ORIGIN” and the end of the sequence is marked by two slashes (“//”). An example sequence in GenBank format is:

LOCUS AB000263 368 bp mRNA linear PRI 05-FEB-1999

DEFINITION Homo sapiens mRNA for prepro cortistatin like peptide, complete cds.

ACCESSION AB000263 ORIGIN

1 acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg

61 ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg caggaagcgg

121 caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag tggacctccc 181 aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg cggcaggaag 241 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac ttcttctgga 301 agaccttctcc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag tttaattaca

361 gacctgaa

// GenBank格式文件可以包含多个序列,每个序列条目都以”LOCUS”开始,紧跟多行注释信息,序列开始标记为”ORIGIN”,序列结束标记为”//”。

6.IG格式

A sequence file in IG format can contain several sequences, each

consisting of a number of comment lines that must begin with a semicolon (“;”), a line with the sequence name (it may not contain spaces!) and the sequence itself terminated with the termination character ’1′ for linear or ’2′ for circular sequences.

An example sequence in IG format is:

; comment

; comment

AB000263

ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCCACCG CCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGAATAAG CTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCCCCTC AAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGCCGGG CTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATGAATG TTTAATTACAGACCTGAA1

IG格式序列文件可以包含多个序列,每个序列条目都以多个comment行开始,且comment行以”;”开始,comment行下面是包含序列名称的一行,序列以数字1结束,第2条序列以2结束,以此类推。 7.IUPAC字符

To represent ambiguity in DNA sequences the following letters can be used (following the rules of the International Union of Pure and Applied Chemistry (IUPAC)):

A = adenine

C = cytosine

G = guanine

T = thymine

U = uracil

R = G A (purine)

Y = T C (pyrimidine)

K = G T (keto)

M = A C (amino)

S = G C

W = A T

B = G T C

D = G A T H = A C T V = G C A

N = A G C T (any)


第二篇:核糖核酸介绍


根据核糖核酸Ⅱ三大药用机理(1提免疫、2抗肿瘤、3促修复),面前产品主要

核糖核酸介绍

核糖核酸介绍

各科室用药原则上以药品说明书为使用依据;此外可参考以下内容: 1、首次应用或前期应用要采取必要的防敏措施;2、用药方式多推荐静脉滴注(用量大,疗效好,刺激性小,患者比较认可),具体可参考《注射用核糖核酸Ⅱ临床使用说明》。

更多相关推荐:
介绍信格式范文

介绍信格式范文介绍信一般要写清下列内容称呼开头顶格写联系单位或个人的称呼正文另起一行空两格写介绍信的内容包括持介绍信人的姓名年龄职务政治面貌要接洽的事项和对对方的希望要求结尾写此致敬礼一类的敬词署名签署单位名称...

单位介绍信格式范文

单位介绍信格式范文一介绍信的概念介绍信是介绍派出人员的身份和任务的专用信件二介绍信的作用1介绍信主要用于联系工作洽谈业务参加会议了解情况时的自我说明2对于持信人而言介绍信具有介绍证明双重作用三介绍信的种类介绍信...

单位介绍信格式范文

单位介绍信格式范文一介绍信的概念介绍信是介绍派出人员的身份和任务的专用信件二介绍信的作用1介绍信主要用于联系工作洽谈业务参加会议了解情况时的自我说明2对于持信人而言介绍信具有介绍证明双重作用三介绍信的种类介绍信...

介绍信格式

介绍信格式范本概念解说介绍信是用来介绍联系接洽事宜的一种应用文体它具有介绍证明的双重作用介绍信主要有两种形式普通介绍信和专用介绍信格式内容普通介绍信一般不带存根正中写quot介绍信quot内容包括称呼正文结尾署...

介绍信格式范本

介绍信格式范本概念解说介绍信是用来介绍联系接洽事宜的一种应用文体它具有介绍证明的双重作用介绍信主要有两种形式普通介绍信和专用介绍信格式内容普通介绍信一般不带存根正中写quot介绍信quot内容包括称呼正文结尾署...

介绍信格式下载

介绍信存根字第号介绍等同志前往签发人年月日有效期天兹介绍的人前往你处联系事宜至请接洽为荷此致敬礼盖章有效期天年月日介绍信存根介绍信字第号介绍等同志前往签发人年月日有效期天兹有等人前往你处希协助为荷此致敬礼有效期...

单位介绍信格式

单位介绍信格式文字大小大中小打印文章范文一xxx公司xx经理兹有我单位x部门经理这里有一个级别问题一般是同级别的人员接待如果有特殊情况也可以区别对待前去贵单位办理事宜请予协助为谢单位介绍人落款本公司盖章xxxx...

介绍信的格式及写法

介绍信的格式及写法概念解说介绍信是用来介绍联系接洽事宜的一种应用文体它具有介绍证明的双重作用介绍信主要有两种形式普通介绍信和专用介绍信格式内容普通介绍信一般不带存根正中写quot介绍信quot内容包括称呼正文结...

介绍信格式范本

HR工具文本范例介绍信格式范本概念解说介绍信是用来介绍联系接洽事宜的一种应用文体它具有介绍证明的双重作用介绍信主要有两种形式普通介绍信和专用介绍信格式内容普通介绍信一般不带存根正中写quot介绍信quot内容包...

介绍信格式

介绍信XXXX兹有XXX予接洽XXX前来你处查询XXXXXX的相关资料请XXXXXXX单位201年月日

介绍信标准格式(横版)

介绍信存根全总文工团字第号介绍等同志前往中央组织部党建读物出版社发行部签发人年月日有效期天兹介绍组织工作文件选编定购事宜至请接洽为荷此致敬礼盖章有效期15天20xx年10月27日介绍信存根介绍信字第号介绍等同志...

单位介绍信格式

单位介绍信格式范文一xxx公司xx经理兹有我单位x部门经理这里有一个级别问题一般是同级别的人员接待如果有特殊情况也可以区别对待前去贵单位办理事宜请予协助为谢单位介绍人落款本公司盖章xxxx年x月x日范文二xx公...

介绍信格式(15篇)