Linux-based Essential Bioinformatics

Linux生物信息技术基础
2026-05-26更新
本站主页 远程登录 教学大纲 教学计划 参考文档 网页制作 交流报告

实例2:976个脊椎动物珠蛋白


研究背景

  1. UniProt/Swiss-Prot蛋白质序列数据库中收录了976个人工注释的脊椎动物珠蛋白基因家族蛋白质序列注释信息
  2. 利用MySQL数据库系统构建数据库,按不同条件进行数据查询,掌握数据库系统基本用法

创建数据表

  1. 从公共目录中复制脊椎动物珠蛋数据/rd1/home/public/mysql/976globin
    数据格式:编号、登录号、序列名、基因名、蛋白名、分类号、物种名、序列长度、收录日期
  2. 创建数据表
    CREATE TABLE 数据表名 ( num INT AUTO_INCREMENT PRIMARY KEY,
    acc CHAR(8),
    ent CHAR(12),
    gen CHAR(10),
    pro CHAR(20),
    tax CHAR(8),
    spe VARCHAR(40),
    len SMALLINT,
    dat DATE );
  3. 导入数据:
    LOAD DATA LOCAL INFILE '976globin' INTO TABLE 976globin;

数据查询

  1. 查看表格976globin列名
    DESCRIBE 976globin;
  2. 查看前10个序列
    SELECT * FROM 976globin LIMIT 10;
  3. 删除第1行中文列名信息
    DELETE FROM 976globin WHERE num=1;
  4. 找出长度超过1000的序列
    SELECT * FROM 976globin WHERE len>1000;
  5. 找出122个基因名为MB/mb且序列长度不小于146的全长肌红蛋白
    SELECT * FROM 976globin WHERE gen='MB' AND len>=146;
  6. 查看13个人的珠蛋白
    SElect * FROM 976globin WHERE tax='9606';
  7. 找出39个Gamma珠蛋白,包括Gamma-1, Gamma-2
    SELECT * FROM 976globin WHERE pro LIKE 'Gamma%';
  8. 查看1986年Swiss-Prot创建时收录的数据
    SELECT * FROM 976globin WHERE dat LIKE '1986%';
  9. 按序列长度从小到大查看前10行信息
    SELECT * FROM 976globin ORDER BY len LIMIT 10;

数据修改

  1. 查看UniProt序列长度和收录历史(History)信息,修改以下10个序列条目错误信息:
    HBA_PIG, HBA_RAT, HBB_PIG, HBB_RAT, HBE_PIG, HBAZ_HUMAN, MYG_PIG, MYG_RAT, NGB_PIG, NGB_RAT
  2. 将HBA_PIG分类号改为9823
    UPDATE 976globin SET tax='9823' WHERE ent='HBA_PIG';
  3. 将HBA_PIG序列长度改为141
    UPDATE FROM 976globin SET len=141 WHERE ent='HBA_PIG';
  4. 将HBA_PIG分类号改为9823
    UPDATE FROM 976globin SET tax=’9823‘ WHERE ent='HBA_PIG';
    UPDATE FROM 976globin SET dat='1988-11-01' WHERE ent='HBA_PIG';
  5. 将HBA_PIG收录日期改为1998-11-01
    UPDATE FROM 976globin SET dat='1988-11-01' WHERE ent='HBA_PIG';
ABC Bio PKU CNCB Linux WSL HTML CSS PHP VSCode Vim VimHelp MySQL UniProt EBI NCBI