Linux-based Essential Bioinformatics

Linux生物信息技术基础
2026-05-26更新
本站主页 远程登录 教学大纲 教学计划 参考文档 网页制作 交流报告

EMBOSS课堂练习


双序列比对算法和参数

  1. 双序列全局比对Needleman-Wunsch算法: Wiki专栏
  2. 双序列全局比对Needleman-Wunsch算法: 知乎专栏
  3. 双序列全局比对Needleman-Wunsch算法: EMBOSS官网帮助文档
  4. 双序列局部比对Smith-Waterman算法: Wiki专栏
  5. 双序列局部比对Smith-Waterman算法: 知乎专栏
  6. 双序列局部比对Smith-Waterman算法: EMBOSS官网帮助文档

双序列比对程序网站

  1. 中国国家生物信息中心: CNCB Needle
  2. 中国国家生物信息中心: CNCB Water
  3. 欧洲生物信息学研究所: EBI Needle
  4. 欧洲生物信息学研究所: EBI Water
  5. 美国国家生物技术信息中心: NCBI BLAST

数据准备

  1. 在用户家目录下创建子目录emboss
  2. 进入子目录emboss
  3. 在子目录emboss下创建二级子目录input和output
  4. 复制服务器公共目录下数据文件到用户二级子目录input中
    cp /rd1/leb26/data/EMBOSS/input/* input
  5. 查看input子目录中所有FASTA序列文件并统计文件数
    ls -1 input/*.FASTA | wc
  6. 查看input子目录中所有GenBank格式文件并统计文件数
    ls -1 input/*.GB | wc

交互式双序列全局比对

  1. 教学服务器EMBOSS软件包Needle程序交互式运行方法:
    cp input/HBA_HUMAN.FASTA .
    cp input/HBA_MOUSE.FASTA .
    cp input/HBA_RAT.FASTA .
    needle
    输入人alpha血红蛋白HBA_HUMAN.FASTA
    输入小鼠alpha血红蛋白HBA_MOUSE.FASTA
    起始空位罚分采用默认值10.0
    延申空位罚分采用默认值0.5
    比对结果保存到文件名human-mouse.needle中
  2. 按上述方法比对大鼠alpha血红蛋白HBA_RAT.FASTA和小鼠alpha血红蛋白HBA_MOUSE.FASTA,保存到rat-mouse.needle中
  3. 阅读参考文献 ABC教学实例, 下载三个物种alpha血红蛋白编码区CDS序列,进行全局比对,分析比对结果。
  4. 将上述分析思路用于相关课题

参数式双序列局部比对

  1. 教学服务器EMBOSS软件包Water程序命令行运行方法:
    cp input/CEA*.FASTA .
    water CEAM3_HUMAN.FASTA CEAM4_HUMAN.FASTA -gapo=10 -gape=0.5 -out=CEA3-CEA4.water
    water CEAM3_HUMAN.FASTA CEAM5_HUMAN.FASTA -gapo=10 -gape=0.5 -out=CEA3-CEA5.water
    water CEAM4_HUMAN.FASTA CEAM5_HUMAN.FASTA -gapo=10 -gape=0.5 -out=CEA4-CEA5.water
  2. 从UniProt蛋白质序列数据库下载课题相关序列,利用上述网络版和命令行进行局部比对,比较不同方法的优缺点
ABC Bio PKU CNCB Linux WSL HTML CSS PHP VSCode Vim VimHelp MySQL UniProt EBI NCBI