南充網(wǎng)站制作他達那非副作用太強了
Minimap2 用戶手冊
概述
- 名稱
- minimap2 - DNA序列集合之間的映射和比對
內(nèi)容
- 簡介
- 描述
- 選項
- 索引選項
- 映射選項
- 對齊選項
- 輸入/輸出選項
- 預設(shè)選項
- 其他選項
- 輸出格式
- 限制
- 參考
簡介
Minimap2是一個快速的序列映射和比對程序,能夠找到長噪聲讀段之間的重疊,或者將長讀段或它們的組裝映射到參考基因組上,并且可以選擇性地進行詳細比對(即CIGAR)。目前,它能夠高效地處理從幾千堿基到約100兆堿基長度的查詢序列,錯誤率約為15%。Minimap2以PAF或SAM格式輸出。
選項
索引選項
k INT
: 最小化k-mer長度 [15]w INT
: 最小化窗口大小 [k-mer長度的2/3]。最小化是w個連續(xù)k-mer窗口中的最小k-mer。H
: 使用同聚物壓縮(HPC)最小化。HPC序列是通過將同聚物運行壓縮為單個堿基來構(gòu)建的。HPC最小化是HPC序列上的最小化。I NUM
: 索引時最多加載NUM個目標堿基到RAM [4G]。--idx-no-seq
: 不在索引中存儲目標序列。節(jié)省磁盤空間和內(nèi)存,但這樣生成的索引將不適用于-a或-c選項。
映射選項
U INT1[,INT2]
: k-mer出現(xiàn)的下限和上限 [10,1000000]。e INT
: 每隔INT堿基對采樣一個高頻最小化 [500]。g NUM
: 如果在NUM-bp內(nèi)沒有最小化,則停止鏈的延伸 [10k]。r NUM1[,NUM2]
: 鏈化和基礎(chǔ)對齊的帶寬 [500,20k]。
對齊選項
A INT
: 匹配得分 [2]。B INT
: 不匹配的懲罰 [4]。O INT1[,INT2]
: 間隙開放懲罰 [4,24]。
輸入/輸出選項
a
: 生成CIGAR并在SAM格式中輸出比對。Minimap2默認以PAF輸出。o FILE
: 將比對輸出到FILE [stdout]。Q
: 在輸入文件中忽略堿基質(zhì)量。
預設(shè)選項
x STR
: 預設(shè) []。這個選項同時應(yīng)用多個選項。它應(yīng)該在其他選項之前應(yīng)用,因為后面應(yīng)用的選項將覆蓋-x設(shè)置的值。
輸出格式
Minimap2默認以成對映射格式(PAF)輸出映射位置。PAF是一個制表符分隔的文本格式,每行至少包含12個字段。
限制
Minimap2在通過長低復雜性區(qū)域時可能產(chǎn)生次優(yōu)比對,因為在這些區(qū)域種子位置可能是次優(yōu)的。
Minimap2需要SSE2或NEON指令來編譯。可以添加非SSE2/NEON支持,但這會使Minimap2的速度慢幾倍。
以下是GitHub上lh3/minimap2頁面的中文翻譯,按照Markdown格式整理:
# 開始使用## 獲取Minimap2
git clone https://github.com/lh3/minimap2
cd minimap2 && make
長序列與參考基因組比對
./minimap2 -a test/MT-human.fa test/MT-orang.fa > test.sam
先創(chuàng)建索引再映射
./minimap2 -x map-ont -d MT-human-ont.mmi test/MT-human.fa
./minimap2 -a MT-human-ont.mmi test/MT-orang.fa > test.sam
使用預設(shè)(無測試數(shù)據(jù))
./minimap2 -ax map-pb ref.fa pacbio.fq.gz > aln.sam # PacBio CLR基因組讀取
./minimap2 -ax map-ont ref.fa ont.fq.gz > aln.sam # Oxford Nanopore基因組讀取
./minimap2 -ax map-hifi ref.fa pacbio-ccs.fq.gz > aln.sam # PacBio HiFi/CCS基因組讀取 (v2.19或更高版本)
./minimap2 -ax lr:hq ref.fa ont-Q20.fq.gz > aln.sam