Linux-based Essential Bioinformatics
Linux生物信息技术基础
2026-05-26更新
实例1:171个血红蛋白alpha亚基
数据准备
-
从UniProt/Swiss-Prot蛋白质序列数据库中下载人的alpha血红蛋白FASTA格式文件
171hba.fas
-
提取注释行信息,保存为
171hba
-
利用Vim编辑系统整理,删除冗余信息,插入第一列空列
最终数据格式:
编号numb, 序列条目名entry, 登录号accnum, 蛋白名protein,属名family, 物种名species, 分类号taxid, 基因名gene
171hba.sql
创建数据表
-
创建数据表
CREATE TABLE 数据表名 (编号numb INT AUTO_INCREMENT PRIMARY KEY, ..., );
-
从数据文件中导入数据
数据查询
-
查看前所有171个HBA信息,熟悉数据特点,包括大小写、排列顺序等基本信息
-
查看前10行信息,熟悉列名含义及其和列值的对应关系
-
用不同方法找出人的血红蛋白
-
找出两个猩猩(黑猩猩Pan Troglodytes和倭黑猩猩Pan paniscus)信息
-
找出基因名为HBA1的5个序列,并和蛋白名进行对比