Linux-based Essential Bioinformatics

Linux生物信息技术基础
2026-05-26更新
本站主页 远程登录 教学大纲 教学计划 参考文档 网页制作 交流报告

实例2:976个脊椎动物珠蛋白


研究背景

  1. UniProt/Swiss-Prot蛋白质序列数据库中收录了976个人工注释的脊椎动物珠蛋白基因家族蛋白质序列注释信息
  2. 利用MySQL数据库系统构建数据库,按不同条件进行数据查询,掌握数据库系统基本用法

创建数据表

  1. 从公共目录中复制脊椎动物珠蛋数据/rd1/home/public/mysql/976globin
    数据格式:编号、登录号、序列名、基因名、蛋白名、分类号、物种名、序列长度、收录日期
  2. 创建数据表
    CREATE TABLE 数据表名 ( 编号 INT AUTO_INCREMENT PRIMARY KEY,
    登录号 数据类型,
    序列名 数据类型,
    基因名 数据类型,
    蛋白名 数据类型,
    分类号 数据类型,
    物种名 数据类型,
    序列长度 数据类型,
    收录日期 数据类型' );
  3. 导入数据: LOAD DATA LOCAL INFILE '数据文件名' INTO 数据表名;

数据查询

  1. 查看长度超过1000的序列
  2. 按序列长度从大到小查看若干个序列
  3. 查看人的珠蛋白
  4. 查看Gamma珠蛋白
  5. 查看1986年Swiss-Prot创建时收录的数据
  6. 查看序列长度小于10的珠蛋白
  7. 查看UniProt数据库,改正数据表中序列长度、创建日期和分类号等错误信息
ABC Bio PKU CNCB Linux WSL HTML CSS PHP VSCode Vim VimHelp MySQL UniProt EBI NCBI