发布网友 发布时间:2022-04-23 09:02
共1个回答
热心网友 时间:2023-10-09 00:06
(一)安装bowtie
Bowtie可以在个人计算机上使用,也可以在CSC服务器上使用终端连接。请参阅以下文档的第一部分,了解如何在笔记本电脑上安装Bowtie。特别是对他们的计算机没有管理员权限的那些应该确保软件的正确安装和功能。Bowtie也可以在服务器计算机上远程使用。我们将提供临时帐户访问CSC,但你将需要一个安全Shell终端程序进行通信。默认情况下,Mac和Linux上都有这样的程序,但需要安装Windows。普遍的实现是PuTTY。即使终端程序不用于读取映射,也将需要其他练习,并且应该可用。Bowtie的安装:从下载页面下载相应的版本(Linux,Mac或Win,小编使用的是在Linux下进行)。将zip文件解压缩到新的目录中,并转到该目录。下载的bowtie包装包含大肠杆菌基因组的预先建立的指数,以及从该基因组模拟的一组1000个35bp的读数。要使用Bowtie对齐这些读取,请键入以下命令。bowtiee_colireads/e_coli_1000.fqmap_result.txt
如果你收到错误消息"commandnotfound",请尝试在"bowtie"(./bowtie)之前添加"./"。
(二)使用Bowtie
(1)Mapping
要使用Bowtie对齐示例读取,请发出以下命令。bowtiee_colireads/e_coli_1000.fqmap_result.txt
如果你收到错误消息"commandnotfound",请尝试在"bowtie"(./bowtie)之前添加"./"。"e_coli"与"indexes/e_coli"相同。你可以在文本编辑器中打开map_result.txt。每行都是一个读取对齐。对齐读取的名称显示在第一列中。对于Mac和Linux,使用"少"会更好。
lessmap_result.txt#extrareading
ReadthemanualinthefolderorwebsitetogetadeeperunderstandinghowBowtieworksandfurtheroptionsinBowtie.
我们来看看Bowtie在1中使用的一些不同的选项,报告所有有效的对齐方式与一些不匹配。
./bowtie-a-v2e_coli--suppress1,5,6,7-cATGCATCATGCGCCAT-a/--all报告每个读取或对的所有有效对齐(默认值:off)
-v
最多不相匹配的报告对齐
-c
查询序列在命令行
--suppress
上以默认输出模式抑制输出列
2*对齐
$./bowtie-k3-v2e_coli--suppress1,5,6,7-cATGCATCATGCGCCAT-k
每次读取或配对时报告有效对齐(默认值:1)。
3不匹配排名
$./bowtie-a--best-v2e_coli--suppress1,5,6,7-cATGCATCATGCGCCAT
所有相同的对齐方式按最佳到最坏的顺序进行报告
4只有最不匹配
$./bowtie-a--best--strata-v2--suppress1,5,6,7e_coli-cATGCATCATG
(2)配对对齐
当使用-1和-2选项指定正确配对的读取文件时,Bowtie可以对齐配对端读取(对于原始,FASTA或FASTQ读取文件)
./bowtiee_coli-1reads/e_coli_1000_1.fq-2reads/e_coli_1000_2.fqmap_paired.txt
SAMtools(http://samtools.sf.net)是一套用于存储,操纵和分析对齐方式的工具,例如Bowtie输出的对齐方式。bowtie-Se_colireads/e_coli_1000.fqec.sam
我们可以再次检查sam文件以查看与txt文件的区别(也是在r4,r5中未映射的读取)。接下来,我们将SAM文件转换为BAM以准备排序。
samtoolsview-bS-oec.bamec.sam
接下来,我们对BAM文件进行排序,
samtoolssortec.bamec.sorted
这样我们就简单的对bam文件中的基因组进行配对对齐。