軟體名稱 | 主要功能 | 分析功能 | 參考文獻 |
---|---|---|---|
AbySS | Genome de novo assembly |
當genome很大時,相對其他軟體,每一個核所使用的記憶體用量少 一個在21個node上計算的人類基因體使用16GB
需自行決定最佳k-mer 大小 如果genome很大,找出最佳的k-mer會頗秏時。 |
View |
ALLPATH-LG | Genome de novo assembly |
可使用long reads (e.g. PAC Bio) 可多核多執行緒運行
大的genomes,如哺乳類,需較大的RAM,約需要512GB才足夠(見使用手冊) |
View |
Edena | Genome de novo assembly |
只能在小genome上使用,如微生物。 |
View |
SOAPdenovo | Genome de novo assembly |
SOAP de novo 使用的RAM比較小,coverage 40x的人類基因需140G。 功能模組化,可分開執行,模組包含read-corrector, assembly, scaffold, gap-filler。
|
View |
軟體名稱 | 主要功能 | 分析功能 | 使用說明 |
---|---|---|---|
AMOS | Assembler development tool AMOScmp is a reference assembler |
AMOS是用於開發assembler的工具,其中AMOScmp是用AMOS寫成的reference assembler。
|
View |
BLAST | Long reads alignment |
BLAST是用來尋找不同序列中相似的區域。這個程式把胺基酸或蛋白質序列與資料庫的序列比對後,計算他們在統計上為一樣序列的顯著性。
BLAST可以用來指出一個序列可能有的功能以及與其他序列在演化上的關系,並且能夠協助找出gene family 中的成員。
【優點】
在比對較為divergent的序列時,結果較BLAT好。
【缺點】
速度慢。
|
View |
BLAT | Long reads alignment |
BLAT與BLAST功能類似但較快速。
BLAT可快速地找出相似度95%以上,長度在40 bases以上的DNA序列。在比較蛋白質序列上,BLAT可找出相似度80%以上,長度在20 bases以上的序列。
【優點】
DNA Blat 在比對人類以及靈長類的序列上表現不錯;而protein Blat 在比較 陸生脊椎動物之間也有不錯的結果。當比對相似(物種)的序列時,速度比BLAST快很多,也比較準確。mRNA/DNA alignment 快 500 倍, protein alignments 快50 倍。
【缺點】
對於比對較divergent 或較短的序列(<40 nucleotides或 <20 amino acids)時,會比BLAST漏掉較多可能的配對。
|
View |
Bowtie | Short reads alignment/mapping |
可使用illumina 和 SOLiD 的數據。
可多執行緒(multi-threading)。
【優點】
速度快
|
View |
BWA | Short/Long reads alignment/mapping |
可使用 illumina, SOLiD 和 454 的數據。
輸出結果分為mapped和unmapped的reads, 較方便分別處理。
【優點】
較bowtie和soap2更為sensitive。
【缺點】
較bowtie和soap2 速度慢。
|
View |
Reference
ERANGE
[主要功能]
CHIP-seq
RNA-seq
RNA-SNP discovery
[功能分析]
同時有 CHIP-Seq and RNA-Seq 分析的功能
目前支援的mapper有bowtie,eland和blat
可分析在同一個或多個genome之間的cis-regulatory element
需要 Cistematic version 的 genomes
需要使用UCSC 的genome序列和gene models
Reference
Quest
[主要功能]
CHIP-seq
[功能分析]
可計算peaks 和 regions 的q-values, p-values 和FDR
比較能夠handle 蛋白質大區域接觸所產生的寬peak
可分析在同一個或多個genome之間的cis-regulatory element
可產生UCSC browser track
可過濾因為repeats 而產生的outlier regions
Reference
Cufflinks
[主要功能]
Transcript abundances estimation
[功能分析]
Cufflinks 使用RNA-Seq reads 去align及assemble出不同的transcripts版本,然後計算不同版本的transcripts在表現上的相對比例。
另外有模組可以比對多個sample的結果,用以找出表現及調控上有差異的基因
Reference
Trinity
[主要功能]
Transcriptome de novo assembl
[優點]
可選執行緒數量
擁有高品質的組合結果
[缺點]
跑的時間長,由於inchworm部分沒有辦法由多執行緒節省太多時間
Reference
TopHat
[主要功能]
Splice junction mapper for RNA-Seq reads
[功能分析]
TopHat 利用超高速短序列之aligner-bowtie, 將RNA-Seq reads與哺乳動物大小的GENOME 做mapping之後分析mapping後的結果以找出exon之間的splice junction
Reference
GSNAP
[主要功能]
Genomic Short-read Nucleotide Alignment
[功能分析]
GSNAP 可以 align 小至14 nt 的single-end 及 paired-end reads
GSNAP可以利用機率模型或已知的splicing site偵測長距離及短距離的splicing, 包括interchromosomal splicing。