如何将欧洲格式的时间序列(千位分隔符)导入python或r
从csv文件导入股票数据时遇到了一些问题,该文件采用欧洲格式,如下所示:如何将欧洲格式的时间序列(千位分隔符)导入python或r,python,r,time-series,read-data,Python,R,Time Series,Read Data,从csv文件导入股票数据时遇到了一些问题,该文件采用欧洲格式,如下所示: Date ;Stock1;Stock2 03.05.2019 ;1.581,70;20,76 30.04.2019 ;1.588,46;20,72 目前我正在使用pandas的read_csv命令。对于第二只股票来说,这很好,而且有了一个快速的解决方法,获得正确的时间指数是没有问题的 然而,stock1的千分之一让我头疼。当它被导入时,python将其视为字符串,而不是浮点,因为。尝试使用千位分隔符,它会破坏我的时间戳
Date ;Stock1;Stock2
03.05.2019 ;1.581,70;20,76
30.04.2019 ;1.588,46;20,72
目前我正在使用pandas的read_csv命令。对于第二只股票来说,这很好,而且有了一个快速的解决方法,获得正确的时间指数是没有问题的
然而,stock1的千分之一让我头疼。当它被导入时,python将其视为字符串,而不是浮点,因为。尝试使用千位分隔符,它会破坏我的时间戳
到目前为止未破坏时间戳的脚本版本:
# Importing the data with a "," as decimal separator
stock_data = pd.read_csv("stock_data.csv", sep = ";", decimal = ",")
# Time indexing
df['Date'] = df['Date'].apply(pd.to_datetime)
df.set_index(df["Date"], inplace = True)
因为我真的被卡住了,我需要一些帮助,要么找到一种方法直接导入这样的日期,要么保持索引不变,而将其余部分作为浮动导入。或者,如何在导入csv文件之前清理它们
非常感谢您的帮助:试试这个
library(readr)
stock_data <- read_csv("stock_data.csv",
locale = locale(decimal_mark = ",", grouping_mark = "."))
View(house_pricing_test)
请看一下帮助文件。在R中,看?读表。有一个函数参数dec。在python中,您可以使用pandas来读取csv。在这种情况下,请查看帮助文档以获取read_csv。此函数有一个类似的参数(如果不是相同的话)。我通常上网阅读pandas文档。谢谢,但我已经在使用pandas的read_csv,我为它刷新了文档,这就是为什么我尝试了上面所述的数千个参数。但是,由于日期分隔符和千位分隔符是相同的,因此熊猫很难正确导入日期和数字。