background shape
軟體名稱 主要功能 分析功能 參考文獻
AbySS Genome de novo assembly
  • 優點:
    • 可平行計算(openMPI)
      當genome很大時,相對其他軟體,每一個核所使用的記憶體用量少
      一個在21個node上計算的人類基因體使用16GB
  • 缺點:
    • 以單核計算來說,相對其他同性質軟體較慢(如allpath-lg, velvet軟體)
      需自行決定最佳k-mer 大小
      如果genome很大,找出最佳的k-mer會頗秏時。
View
ALLPATH-LG Genome de novo assembly
  • 優點:
    • 好的 scaffold length 及 contig length (比 SOAP denovo 好)[4]
      可使用long reads (e.g. PAC Bio)
      可多核多執行緒運行
  • 缺點:
    • input data需要符合特別條件
      大的genomes,如哺乳類,需較大的RAM,約需要512GB才足夠(見使用手冊)
View
Edena Genome de novo assembly
  • 優點:
    • 有strict 模式,可產生非常低錯誤(low misassembling)的contigs。
  • 缺點:
    • 所有的reads必需等長。
      只能在小genome上使用,如微生物。
View
SOAPdenovo Genome de novo assembly
  • 優點:
    • SOAP de novo 非常快,可能是目前最快的 assembler。
      SOAP de novo 使用的RAM比較小,coverage 40x的人類基因需140G。
      功能模組化,可分開執行,模組包含read-corrector, assembly, scaffold, gap-filler。
  • 缺點:
    • 做出來的quality沒有Velvet和Abyss好。
View
軟體名稱 主要功能 分析功能 使用說明
AMOS Assembler development tool AMOScmp is a reference assembler
AMOS是用於開發assembler的工具,其中AMOScmp是用AMOS寫成的reference assembler。
View
BLAST Long reads alignment
BLAST是用來尋找不同序列中相似的區域。這個程式把胺基酸或蛋白質序列與資料庫的序列比對後,計算他們在統計上為一樣序列的顯著性。
BLAST可以用來指出一個序列可能有的功能以及與其他序列在演化上的關系,並且能夠協助找出gene family 中的成員。
【優點】 在比對較為divergent的序列時,結果較BLAT好。
【缺點】 速度慢。
View
BLAT Long reads alignment
BLAT與BLAST功能類似但較快速。
BLAT可快速地找出相似度95%以上,長度在40 bases以上的DNA序列。在比較蛋白質序列上,BLAT可找出相似度80%以上,長度在20 bases以上的序列。
【優點】 DNA Blat 在比對人類以及靈長類的序列上表現不錯;而protein Blat 在比較 陸生脊椎動物之間也有不錯的結果。當比對相似(物種)的序列時,速度比BLAST快很多,也比較準確。mRNA/DNA alignment 快 500 倍, protein alignments 快50 倍。
【缺點】 對於比對較divergent 或較短的序列(<40 nucleotides或 <20 amino acids)時,會比BLAST漏掉較多可能的配對。
View
Bowtie Short reads alignment/mapping
可使用illumina 和 SOLiD 的數據。
可多執行緒(multi-threading)。
【優點】 速度快
View
BWA Short/Long reads alignment/mapping
可使用 illumina, SOLiD 和 454 的數據。
輸出結果分為mapped和unmapped的reads, 較方便分別處理。
【優點】 較bowtie和soap2更為sensitive。
【缺點】 較bowtie和soap2 速度慢。
View
Reference

ERANGE

[主要功能]
  CHIP-seq
  RNA-seq
  RNA-SNP discovery
[功能分析]
  同時有 CHIP-Seq and RNA-Seq 分析的功能
  目前支援的mapper有bowtie,eland和blat
  可分析在同一個或多個genome之間的cis-regulatory element
  需要 Cistematic version 的 genomes
  需要使用UCSC 的genome序列和gene models
Reference

Quest

[主要功能]
  CHIP-seq
[功能分析]
  可計算peaks 和 regions 的q-values, p-values 和FDR
  比較能夠handle 蛋白質大區域接觸所產生的寬peak
  可分析在同一個或多個genome之間的cis-regulatory element
  可產生UCSC browser track
  可過濾因為repeats 而產生的outlier regions
Reference

Cufflinks

[主要功能]
  Transcript abundances estimation
[功能分析]
  Cufflinks 使用RNA-Seq reads 去align及assemble出不同的transcripts版本,然後計算不同版本的transcripts在表現上的相對比例。
  另外有模組可以比對多個sample的結果,用以找出表現及調控上有差異的基因
Reference

Trinity

[主要功能]
  Transcriptome de novo assembl
[優點]
  可選執行緒數量
  擁有高品質的組合結果
[缺點]
  跑的時間長,由於inchworm部分沒有辦法由多執行緒節省太多時間
Reference

TopHat

[主要功能]
  Splice junction mapper for RNA-Seq reads
[功能分析]
  TopHat 利用超高速短序列之aligner-bowtie, 將RNA-Seq reads與哺乳動物大小的GENOME 做mapping之後分析mapping後的結果以找出exon之間的splice junction
Reference

GSNAP

[主要功能]
  Genomic Short-read Nucleotide Alignment
[功能分析]
  GSNAP 可以 align 小至14 nt 的single-end 及 paired-end reads
  GSNAP可以利用機率模型或已知的splicing site偵測長距離及短距離的splicing, 包括interchromosomal splicing。