Linux-based Essential Bioinformatics
Linux生物信息技术基础
2026-05-26更新
实例2:976个脊椎动物珠蛋白
研究背景
-
UniProt/Swiss-Prot蛋白质序列数据库中收录了976个人工注释的脊椎动物珠蛋白基因家族蛋白质序列注释信息
-
利用MySQL数据库系统构建数据库,按不同条件进行数据查询,掌握数据库系统基本用法
创建数据表
-
从公共目录中复制脊椎动物珠蛋数据/rd1/home/public/mysql/976globin
数据格式:编号、登录号、序列名、基因名、蛋白名、分类号、物种名、序列长度、收录日期
-
创建数据表
CREATE TABLE 数据表名 (
编号 INT AUTO_INCREMENT PRIMARY KEY,
登录号 数据类型,
序列名 数据类型,
基因名 数据类型,
蛋白名 数据类型,
分类号 数据类型,
物种名 数据类型,
序列长度 数据类型,
收录日期 数据类型'
);
-
导入数据: LOAD DATA LOCAL INFILE '数据文件名' INTO 数据表名;
数据查询
-
查看长度超过1000的序列
-
按序列长度从大到小查看若干个序列
-
查看人的珠蛋白
-
查看Gamma珠蛋白
-
查看1986年Swiss-Prot创建时收录的数据
-
查看序列长度小于10的珠蛋白
-
查看UniProt数据库,改正数据表中序列长度、创建日期和分类号等错误信息