Linux-based Essential Bioinformatics
Linux生物信息技术基础
2026-05-26更新
实例2:976个脊椎动物珠蛋白
研究背景
-
UniProt/Swiss-Prot蛋白质序列数据库中收录了976个人工注释的脊椎动物珠蛋白基因家族蛋白质序列注释信息
-
利用MySQL数据库系统构建数据库,按不同条件进行数据查询,掌握数据库系统基本用法
创建数据表
-
从公共目录中复制脊椎动物珠蛋数据/rd1/home/public/mysql/976globin
数据格式:编号、登录号、序列名、基因名、蛋白名、分类号、物种名、序列长度、收录日期
-
创建数据表
CREATE TABLE 数据表名 (
num INT AUTO_INCREMENT PRIMARY KEY,
acc CHAR(8),
ent CHAR(12),
gen CHAR(10),
pro CHAR(20),
tax CHAR(8),
spe VARCHAR(40),
len SMALLINT,
dat DATE
);
-
导入数据:
LOAD DATA LOCAL INFILE '976globin' INTO TABLE 976globin;
数据查询
-
查看表格976globin列名
DESCRIBE 976globin;
-
查看前10个序列
SELECT * FROM 976globin LIMIT 10;
-
删除第1行中文列名信息
DELETE FROM 976globin WHERE num=1;
-
找出长度超过1000的序列
SELECT * FROM 976globin WHERE len>1000;
-
找出122个基因名为MB/mb且序列长度不小于146的全长肌红蛋白
SELECT * FROM 976globin WHERE gen='MB' AND len>=146;
-
查看13个人的珠蛋白
SElect * FROM 976globin WHERE tax='9606';
-
找出39个Gamma珠蛋白,包括Gamma-1, Gamma-2
SELECT * FROM 976globin WHERE pro LIKE 'Gamma%';
-
查看1986年Swiss-Prot创建时收录的数据
SELECT * FROM 976globin WHERE dat LIKE '1986%';
-
按序列长度从小到大查看前10行信息
SELECT * FROM 976globin ORDER BY len LIMIT 10;
数据修改
-
查看UniProt序列长度和收录历史(History)信息,修改以下10个序列条目错误信息:
HBA_PIG, HBA_RAT, HBB_PIG, HBB_RAT, HBE_PIG, HBAZ_HUMAN, MYG_PIG, MYG_RAT, NGB_PIG, NGB_RAT
-
将HBA_PIG分类号改为9823
UPDATE 976globin SET tax='9823' WHERE ent='HBA_PIG';
-
将HBA_PIG序列长度改为141
UPDATE FROM 976globin SET len=141 WHERE ent='HBA_PIG';
-
将HBA_PIG分类号改为9823
UPDATE FROM 976globin SET tax=’9823‘ WHERE ent='HBA_PIG';
UPDATE FROM 976globin SET dat='1988-11-01' WHERE ent='HBA_PIG';
-
将HBA_PIG收录日期改为1998-11-01
UPDATE FROM 976globin SET dat='1988-11-01' WHERE ent='HBA_PIG';