无法在python中删除CSV中具有不同表格式的行
我正在CSV中播放一些数据 我想删除“时间戳为UTC时区”和“https://www.CryptoDataDownload.com“在文件中。我一直试图通过无法在python中删除CSV中具有不同表格式的行,python,pandas,csv,Python,Pandas,Csv,我正在CSV中播放一些数据 我想删除“时间戳为UTC时区”和“https://www.CryptoDataDownload.com“在文件中。我一直试图通过drop()删除pandas中的这些项目,并调整axis、label和一些其他参数,但没有用。因为包含这些项目的行没有标签,所以我无法真正查看标签。我发现其他一些帖子需要创建一个列表来处理(例如),或者通过导入csv(例如)。但我只是想知道是否有可能通过熊猫来做到这一点?由于这将是一个重复的过程,有许多csv,这将是花费资源,通过csv包(我
drop()
删除pandas中的这些项目,并调整axis、label和一些其他参数,但没有用。因为包含这些项目的行没有标签,所以我无法真正查看标签。我发现其他一些帖子需要创建一个列表来处理(例如),或者通过导入csv
(例如)。但我只是想知道是否有可能通过熊猫来做到这一点?由于这将是一个重复的过程,有许多csv,这将是花费资源,通过csv包(我猜?)
我真正想做的是删除列“Unix Timestamp”,并将“Date”更改为“datetime\u UTC”,这样我就可以将datetime格式转换为“Date”(目前为止,我似乎无法使用名称“Date”来转换pandas中的datetime格式)。但是“时间戳是UTC时区”和https://www.CryptoDataDownload.com“已阻止处理熊猫中的列删除
非常感谢 对于示例文件,使用
pd.read\u csv
方法的关键字skiprows
就足够了
import pandas as pd
df = pd.read_csv('https://www.cryptodatadownload.com/cdd/Okcoin_BTCUSD_1h.csv', skiprows=1)
运行此代码后,方法df.info()
呈现以下结果:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 29650 entries, 0 to 29649
Data columns (total 9 columns):
Unix Timestamp 29650 non-null float64
Date 29650 non-null object
Symbol 29650 non-null object
Open 29650 non-null float64
High 29650 non-null float64
Low 29650 non-null float64
Close 29650 non-null float64
Volume BTC 29650 non-null float64
Volume USD 29650 non-null float64
dtypes: float64(7), object(2)
memory usage: 2.0+ MB
范围索引:29650个条目,0到29649
数据列(共9列):
Unix时间戳29650非空浮点64
日期29650非空对象
符号29650非空对象
打开29650非空浮点64
高29650非空浮点64
低29650非空浮点64
关闭29650非空浮点64
卷BTC 29650非空浮点64
数量29650美元非零浮动64
数据类型:float64(7),object(2)
内存使用率:2.0+MB
谢谢!它工作得很好!简单好奇,如果我真的想删除行,唯一的方法是通过csv包?