创建mysql表并加载数据
我面临一个问题 我有这些数据。数据存储在gene_ontology.txt中,该文件从以下文件中提取: 在该数据中,第二列中有多个字符串“-”、“,”,以及字符串和数字之间的空格 要举例说明数据,请执行以下操作:创建mysql表并加载数据,mysql,unix,warnings,bioinformatics,Mysql,Unix,Warnings,Bioinformatics,我面临一个问题 我有这些数据。数据存储在gene_ontology.txt中,该文件从以下文件中提取: 在该数据中,第二列中有多个字符串“-”、“,”,以及字符串和数字之间的空格 要举例说明数据,请执行以下操作: GO:0000001,mitochondrion inheritance GO:0000002,mitochondrial genome maintenance GO:0000003,reproduction GO:0000005,ribosomal-chaperone activit
GO:0000001,mitochondrion inheritance
GO:0000002,mitochondrial genome maintenance
GO:0000003,reproduction
GO:0000005,ribosomal-chaperone activity
GO:0000006,high affinity zinc uptake transmembrane transporter......
我想在我创建的表中插入该数据,如下所示:
mysql> create table annotation
-> (GOid VARCHAR(255) NOT NULL,
-> FUNCTION TEXT NOT NULL,
-> PRIMARY KEY goid (goid));
当我加载时:
LOAD DATA LOCAL INFILE 'gene_ontology.txt' INTO TABLE annotation FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n';
Query OK, 26077 rows affected, 1639 warnings (0.89 sec)
Records: 26083 Deleted: 0 Skipped: 6 Warnings: 1639 (<- LOADING GAVE ME WARNING AND SKIPPED RESULTS)
表现良好
+-------------+
| GOid |
+-------------+
| GO:0000001 |
| GO:0000002 |
| GO:0000003 |
| GO:0000005 |
| GO:0000006 |
+-------------+
但是,问题是当我选择两列时:
mysql> SELECT GOid, FUNCTION FROM annotation LIMIT 10;
+-------------+----------------------------------------------------------------+
| GOid | FUNCTION |
+-------------+----------------------------------------------------------------+
|nce
|enome maintenance
|
| activity
|GO:0000006 | high affinity zinc uptake transmembrane transporter activity
|000007 | low-affinity zinc ion transmembrane transporter activity
|
| GO:0000009 | alpha-1 |
|hexaprenyltranstransferase activity
|
+-------------+----------------------------------------------------------------+
或者只有第二个:
+----------------------------------------------------------------+
| FUNCION |
+----------------------------------------------------------------+
|
|nce
|
|
|igh affinity zinc uptake transmembrane transporter activity
|ffinity zinc ion transmembrane transporter activity
|
| alpha-1 |
|stransferase activity
|
+----------------------------------------------------------------+
我不知道发生了什么事。
为了解决这个问题,我尝试改变“函数”的类型,使用长文本和BLOB。
我做了这些更改,因为我认为问题在于第二列(函数)的类型。
但我没有成功。问题似乎是第二列文本之间的逗号“,”有问题 尝试将整个文件作为固定宽度加载到
表a
中的一列中。然后使用substr()
将第一个字段放入第二个表TableB的
column1,而将第二个字段放入column2
这可能会加载数据,您可以进一步分析数据以改进加载过程。问题似乎在于第二列文本之间的逗号“,” 尝试将整个文件作为固定宽度加载到
表a
中的一列中。然后使用substr()
将第一个字段放入第二个表TableB的
column1,而将第二个字段放入column2
这可能会加载数据,您可以进一步分析数据以改进加载过程。您可以输出
head gene\u ontology.txt
。通过编辑功能添加您的帖子,功能?哪个?请注意,8.0.1中保留了该功能。您可以输出head gene\u ontology.txt
。通过编辑功能添加您的帖子,功能?哪个?请注意,该功能在8.0.1中被保留
+----------------------------------------------------------------+
| FUNCION |
+----------------------------------------------------------------+
|
|nce
|
|
|igh affinity zinc uptake transmembrane transporter activity
|ffinity zinc ion transmembrane transporter activity
|
| alpha-1 |
|stransferase activity
|
+----------------------------------------------------------------+