Linux-based Essential Bioinformatics
Linux生物信息技术基础
2026-05-26更新
EMBOSS课堂练习
双序列比对算法和参数
-
双序列全局比对Needleman-Wunsch算法:
Wiki专栏
-
双序列全局比对Needleman-Wunsch算法:
知乎专栏
-
双序列全局比对Needleman-Wunsch算法:
EMBOSS官网帮助文档
-
双序列局部比对Smith-Waterman算法:
Wiki专栏
-
双序列局部比对Smith-Waterman算法:
知乎专栏
-
双序列局部比对Smith-Waterman算法:
EMBOSS官网帮助文档
双序列比对程序网站
-
中国国家生物信息中心:
CNCB Needle
-
中国国家生物信息中心:
CNCB Water
-
欧洲生物信息学研究所:
EBI Needle
-
欧洲生物信息学研究所:
EBI Water
-
美国国家生物技术信息中心:
NCBI BLAST
数据准备
-
在用户家目录下创建子目录emboss
-
进入子目录emboss
-
在子目录emboss下创建二级子目录input和output
-
复制服务器公共目录下数据文件到用户二级子目录input中
cp /rd1/leb26/data/EMBOSS/input/* input
-
查看input子目录中所有FASTA序列文件并统计文件数
ls -1 input/*.FASTA | wc
-
查看input子目录中所有GenBank格式文件并统计文件数
ls -1 input/*.GB | wc
交互式双序列全局比对
-
教学服务器EMBOSS软件包Needle程序交互式运行方法:
cp input/HBA_HUMAN.FASTA .
cp input/HBA_MOUSE.FASTA .
cp input/HBA_RAT.FASTA .
needle
输入人alpha血红蛋白HBA_HUMAN.FASTA
输入小鼠alpha血红蛋白HBA_MOUSE.FASTA
起始空位罚分采用默认值10.0
延申空位罚分采用默认值0.5
比对结果保存到文件名human-mouse.needle中
-
按上述方法比对大鼠alpha血红蛋白HBA_RAT.FASTA和小鼠alpha血红蛋白HBA_MOUSE.FASTA,保存到rat-mouse.needle中
-
阅读参考文献
ABC教学实例,
下载三个物种alpha血红蛋白编码区CDS序列,进行全局比对,分析比对结果。
-
将上述分析思路用于相关课题
参数式双序列局部比对
-
教学服务器EMBOSS软件包Water程序命令行运行方法:
cp input/CEA*.FASTA .
water CEAM3_HUMAN.FASTA CEAM4_HUMAN.FASTA -gapo=10 -gape=0.5 -out=CEA3-CEA4.water
water CEAM3_HUMAN.FASTA CEAM5_HUMAN.FASTA -gapo=10 -gape=0.5 -out=CEA3-CEA5.water
water CEAM4_HUMAN.FASTA CEAM5_HUMAN.FASTA -gapo=10 -gape=0.5 -out=CEA4-CEA5.water
-
从UniProt蛋白质序列数据库下载课题相关序列,利用上述网络版和命令行进行局部比对,比较不同方法的优缺点