将包含大量列的大型csv导入postgreSQL_Postgresql_Csv - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/postgresql/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将包含大量列的大型csv导入postgreSQL_Postgresql_Csv - Fatal编程技术网

将包含大量列的大型csv导入postgreSQL

postgresql csv

将包含大量列的大型csv导入postgreSQL,postgresql,csv,Postgresql,Csv,我有一个2550列的csv文件，我想把它导入postgreSQL 为了在postgreSQL中导入csv，首先我应该创建表，并使用\copy将csv复制到表中。但是，如果表中有大量的列，比如我的案例，我无法手动创建表，该怎么办呢有解决办法吗更新数据结构如下： dZ（01）到dZ（2550）基本上在-50到+50之间： id | date | time | localtime | pid | dZ(0)..dZ(1)......dZ(2550)| ---|---------|

我有一个2550列的csv文件，我想把它导入postgreSQL

为了在postgreSQL中导入csv，首先我应该创建表，并使用

\copy

将csv复制到表中。但是，如果表中有大量的列，比如我的案例，我无法手动创建表，该怎么办呢

有解决办法吗

更新

数据结构如下： dZ（01）到dZ（2550）基本上在-50到+50之间：

id | date    | time      | localtime | pid | dZ(0)..dZ(1)......dZ(2550)|
---|---------|-----------|-----------|-----|---------------------------|
17|11-11-2014| 16:33:21 | 1.45E+15   |2375 |0 0 0 0 0 -1 0 -1 0 -5 -10|

CSV结构：（我使用了“；”分隔符）

这是一行数据。

将

dZ

列导入文本列，然后将其转换为数组：

create table t (
    id int,
    datetime timestamp,
    localt double precision,
    pid int,
    dz integer[]
);

创建临时表：

create table s (
    id int,
    date date,
    time time,
    localt double precision,
    pid int,
    dz text
);

设置日期样式：

set datestyle = 'DMY';

导入到临时表中

\copy s from '/home/cpn/codigo/file.csv' with (format csv, delimiter ';')

创建最终表格，将日期和时间合并为时间戳，并将

dZ

转换为数组：

create table t (
    id int,
    datetime timestamp,
    localt double precision,
    pid int,
    dz integer[]
);

从临时文件中填充最终文件：

insert into t (id, datetime, localt, pid, dz)
select
    id, date + time, localt, pid,
    regexp_split_to_array(dz, '\s')::int[]
from s

将

dZ

列导入文本列，然后将其转换为数组：

create table t (
    id int,
    datetime timestamp,
    localt double precision,
    pid int,
    dz integer[]
);

创建临时表：

create table s (
    id int,
    date date,
    time time,
    localt double precision,
    pid int,
    dz text
);

设置日期样式：

set datestyle = 'DMY';

导入到临时表中

\copy s from '/home/cpn/codigo/file.csv' with (format csv, delimiter ';')

创建最终表格，将日期和时间合并为时间戳，并将

dZ

转换为数组：

create table t (
    id int,
    datetime timestamp,
    localt double precision,
    pid int,
    dz integer[]
);

从临时文件中填充最终文件：

insert into t (id, datetime, localt, pid, dz)
select
    id, date + time, localt, pid,
    regexp_split_to_array(dz, '\s')::int[]
from s

考虑到最大值为1600列，所以我将csv分为两个表，每个表有1000列，我编写了一个python代码来创建dz列，效果很好：

import psycopg2
sqlstring="CREATE TABLE z(id bigint, date date, time time,"
for i in range(1001):
    if(i<1000):
        sqlstring+="dz"+str(i)+ " int,"
    elif i==1000:
        sqlstring+="dz"+str(i)+ " int"        
sqlstring += ");"

connection = psycopg2.connect("dbname='mydb' user='qfsa' host='localhost' password='123' port=5433")
cursor=connection.cursor();
cursor.execute(sqlstring)
connection.commit()

导入psycopg2
sqlstring=“创建表z（id bigint、日期、时间，”
对于范围（1001）内的i：
如果（i考虑到最大值是1600列，所以我将csv分为两个表，每个表有1000列，我编写了一个python代码来创建dz列，它工作得很好：
import psycopg2
sqlstring="CREATE TABLE z(id bigint, date date, time time,"
for i in range(1001):
    if(i<1000):
        sqlstring+="dz"+str(i)+ " int,"
    elif i==1000:
        sqlstring+="dz"+str(i)+ " int"        
sqlstring += ");"

connection = psycopg2.connect("dbname='mydb' user='qfsa' host='localhost' password='123' port=5433")
cursor=connection.cursor();
cursor.execute(sqlstring)
connection.commit()

导入psycopg2
sqlstring=“创建表z（id bigint、日期、时间，”
对于范围（1001）内的i：
如果（我回答有点老了，只是为了那些还在看的人。
这可以使用python来完成
将数据帧中的数据视为df
df= df.rename(columns=str.lower)

from sqlalchemy import create_engine
engine = create_engine('postgresql://username:password@localhost:5432/mydatabase')

df.to_sql('table_name', engine)

回答有点老了，只是为了方便那些仍在寻找答案的人。
这可以使用python来完成
将数据帧中的数据视为df
df= df.rename(columns=str.lower)

from sqlalchemy import create_engine
engine = create_engine('postgresql://username:password@localhost:5432/mydatabase')

df.to_sql('table_name', engine)

恐怕表中的列数限制在1600列以内，所以您可能需要尝试设置自定义分隔符并将整行作为一列导入，以便以后您可以选择split\u part
或regex作为几列。但无论如何，您无法将所有2550行导入同一个表。每一行有多大？可能您需要uld将其导入一个只有一列的表中，并在数据库中处理。一个有那么多列的表在关系数据库中没有多大意义。看起来像重复组。可能将其存储到数组中？顺便说一句：日期+时间应该是一（时间戳）字段。可以使用外部数据包装器将CSV文件的行映射到Postgres中的单个数组。然后可以使用Postgres数组函数拆分表或获取“列”的子集恐怕表中的列数限制为1600列，因此您可能需要尝试设置自定义分隔符，并将整行作为一列导入，以便稍后您可以选择split\u part
或regex到多个列中。但无论如何，您无法将所有2550行导入到同一个表中。每一行有多大？也许您可以导入将其排序到只有一列的表中，并在数据库中处理。在关系数据库中，有那么多列的表没有多大意义。看起来像重复组。可能将其存储到数组中？顺便说一句：日期+时间应该是一（时间戳）字段。可以使用外部数据包装器将CSV文件的行映射到Postgres中的单个数组。然后可以使用Postgres数组函数拆分表或获取“列”的子集2500列的表很难闻！我喜欢你的数组解决方案。也许目标表结构应该规范化为每行1个值或其他什么。除非数组真的有意义。我尝试了这个解决方案，但数组在s和t表中都是空的。我用数据结构更新了我的问题，知道吗？@Safariba我会检查它稍后。@Safariba将分隔符更改为；
，并修复了\copy
命令中的语法错误。将localtime
列的数据类型更改为double precision
。现在使用提供的数据它对我有效。具有2500列的表味道不好！我喜欢您的数组解决方案。可能是目标表st结构应该规范化为每行1个值或其他值。除非数组真的有意义。我尝试了这个解决方案，但数组在s和t表中都是空的。我用数据结构更新了我的问题，知道吗？@Safariba我稍后会检查。@Safariba将分隔符更改为；
，并修复了中的语法错误\复制
命令。将localtime
列的数据类型更改为double precision
。现在，它对提供的数据适用。




[csv]相关文章推荐



                                                        
“保存到驱动器”按钮将CSV转换为Google工作表
csvgoogle-drive-api 
在Haskell中从Web下载CSV文件
csvhaskell 
将配置单元表导出到csv时列数不正确
csvhive 
将CSV文件导入HSQLDB
csv 
使用powershell 2.0将csv上载到sql
csvpowershell 
如何在一个事务中复制多个CSV？
csvtransactions 
如何将.h5文件转换为.csv？
csv 
使用CSV管道将CSV文件解析为自定义数据类型
csvhaskell 
使用p:dataExporter覆盖导出CSV文件中primefaces表的列名
csvjsfprimefaces 
在elixir中将EXTO模式写入csv文件？
csvelixir 
是否可以在AWS Athena CSV文件中设置标题？
csv 
PrimeFaces数据表csv导出的代码在哪里？
csvjsfprimefaces 
将CSV文件导入为矩阵
csvjulia 
Csv 如何保持org.json.JSONObject？；
csv 
WEKA-CSV加载中的流标头错误无效
csv 
按特定列的值拆分CSV文件
csv 
Csv 带有时间序列X轴的C3/D3时间序列图
csv 
使用Prolog将csv文件中的数据解析为给定格式
csvprolog 
Csv AWK命令在AIX上未按预期工作
csvawk 
使用VBScript从CSV文件中删除列
csvvbscript 
                                       





随机文章推荐



                                                        
Certificate 使用ECDSA密钥时获取签名的x509
certificate 
Certificate 如何使用openssl根据信任链验证P7b证书？
certificateopenssl 
Certificate SSL证书可以用于对文件进行数字签名吗？
certificate 
Certificate delta CRL过期时的PKI客户端行为
certificate 
Certificate 无法在Windows上安装巧克力模块（证书错误？）
certificatepuppet 
Certificate Bluemix-如何将证书添加到信任存储
certificateibm-cloud 
Certificate 证书的颁发者无效：keychain
certificate 
Certificate 关于Installshield中的代码签名证书
certificate 
Certificate 如何让emulator停止要求证书
certificate 
Certificate 在azure容器实例上设置TLS SSL版本1.2
certificate


                                        

                                        
                                        


                                                
                                                        [postgresql]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Macros
Rust
Ibm Mobilefirst
Less
Visual Studio 2008
Swiftui
Jquery Ui
Cygwin
Combobox
Stanford Nlp
Dictionary
Vmware
Wordpress
Seo
Sql Server
Plot
Parsing
Computer Science
Notifications
Android Studio
Interface
Login
Security
Cordova
Kendo Ui
Compilation
Openlayers 3
Numpy
Push Notification
Sails.js
Android
Reflection
Workflow
Character Encoding
Coding Style
Language Agnostic
Ios7
Geolocation
D
Windows Installer
Maven 2
Mono
Xaml
Docker Compose
Google Apps Script
Scikit Learn
Cakephp
Loops
Quickbooks
Stored Procedures
Orm
Polymer
Mfc
Backbone.js
Spring Batch
Tridion
Clearcase
Monitoring
Abap
Identityserver4
Powerbi
Fluent Nhibernate
Mdx
Ignite
Azure Cosmosdb
Pycharm
Redux
Bluetooth
Google Api
Laravel 5
Jakarta Ee
Matplotlib
Web Services
Sharepoint 2007
Prestashop
Visual Studio
Selenium Webdriver
Nservicebus
Xslt
Jersey
Extjs4
Git
Vb6
Zurb Foundation
Dynamics Crm 2011
Apache Flex
Sql Server 2005
Vim
Npm
Sharepoint 2013
Authentication
Openstack
Woocommerce
Curl
Uwp
Uml
Windows 10
Tensorflow
Tcl
Twitter Bootstrap 3
Facebook Graph Api
Visual C++
Mpi
Swift2
Primefaces
Sapui5
Opencl
Navigation
Prolog
Oracle Apex
Jsf 2
Sublimetext2
Module
Sed
Exchange Server
Google Drive Api
Leaflet
Mediawiki
Octave
Jasmine
Oracle10g
Openlayers
Jdbc
Binding
Gnuplot
Configuration
Marklogic
Sharepoint
Ansible
Keycloak
Playframework 2.0
Pascal
Rest
Blockchain
File
Common Lisp
EmptyTag
Office Js
Postgresql
Model View Controller
Firebase
Methods
Crystal Reports
Autohotkey
Events
Instagram
Arangodb
Certificate
Amazon Web Services
Unity3d
Odata
Google Chrome Devtools
Xamarin.ios
Eclipse Plugin
Import
Xcode4
Nosql
Asterisk
Jhipster
Youtube
Https
Extjs
Browser
Sms
Websocket
Windows Mobile
Virtualbox
Utf 8
Xml
Plsql
Jqgrid
Pentaho
Google Chrome Extension
Silverlight 4.0
Soap
Function
Youtube Api
Object
Windows Phone 8
Powershell
Colors
Amazon Cloudformation
Inheritance
Google Calendar Api
Google App Engine
Sql
Recursion
Gdb
Programming Languages
Dialogflow Es
Math
Windows Runtime
Sbt
Julia
Matrix
Visual Studio 2012
Embedded
Windows Phone
Junit
Build
Phpstorm


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网