Linux-based Essential Bioinformatics

Linux生物信息技术基础
2026-05-26更新
本站主页 远程登录 教学大纲 教学计划 参考文档 网页制作 交流报告

实例1:171个血红蛋白alpha亚基


数据准备

  1. 从UniProt/Swiss-Prot蛋白质序列数据库中下载人的alpha血红蛋白FASTA格式文件 171hba.fas
  2. 提取注释行信息,保存为 171hba
  3. 利用Vim编辑系统整理,删除冗余信息,插入第一列空列
    最终数据格式:
    编号numb, 序列条目名entry, 登录号accnum, 蛋白名protein,属名family, 物种名species, 分类号taxid, 基因名gene 171hba.sql

创建数据表

  1. 创建数据表
    CREATE TABLE 数据表名 (编号numb INT AUTO_INCREMENT PRIMARY KEY, ..., );
  2. 从数据文件中导入数据

数据查询

  1. 查看前所有171个HBA信息,熟悉数据特点,包括大小写、排列顺序等基本信息
  2. 查看前10行信息,熟悉列名含义及其和列值的对应关系
  3. 用不同方法找出人的血红蛋白
  4. 找出两个猩猩(黑猩猩Pan Troglodytes和倭黑猩猩Pan paniscus)信息
  5. 找出基因名为HBA1的5个序列,并和蛋白名进行对比
ABC Bio PKU CNCB Linux WSL HTML CSS PHP VSCode Vim VimHelp MySQL UniProt EBI NCBI