Python 从url导入以制表符分隔的表,以生成一个数据框架,并将每列正确地放入单独的列中
我有一个位于URL的汽车数据表。数据似乎是以制表符分隔的。以下是网址:Python 从url导入以制表符分隔的表,以生成一个数据框架,并将每列正确地放入单独的列中,python,pandas,import,Python,Pandas,Import,我有一个位于URL的汽车数据表。数据似乎是以制表符分隔的。以下是网址: auto_table = 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data' 以下是几行数据: 18.0 8 307.0 130.0 3504. 12.0 70 1 "chevrolet chevelle malibu" 15.0 8 350.0
auto_table = 'https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data'
以下是几行数据:
18.0 8 307.0 130.0 3504. 12.0 70 1 "chevrolet chevelle malibu"
15.0 8 350.0 165.0 3693. 11.5 70 1 "buick skylark 320"
18.0 8 318.0 150.0 3436. 11.0 70 1 "plymouth satellite"
16.0 8 304.0 150.0 3433. 12.0 70 1 "amc rebel sst"
17.0 8 302.0 140.0 3449. 10.5 70 1 "ford torino"
15.0 8 429.0 198.0 4341. 10.0 70 1 "ford galaxie 500"
我尝试使用pandas.read_table('auto_table')将数据作为pandas数据帧导入。但是,Python只将数据导入两列:第一列包含所有这些数字/浮点/整数列,第二列正确地包含所有字符串(汽车名称)
如何使用Python导入这些数据以生成一个pandas数据框架,并将所有这些数据正确地分隔到它们自己的唯一列中。我已经查看了pandas.read_表的文档,但我似乎不知道如何正确导入该表。它似乎是一个固定宽度的文件,因此我们可以使用: 使用sep
pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/\
auto-mpg/auto-mpg.data', sep='\s+')
或
成功了。非常感谢。
pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/\
auto-mpg/auto-mpg.data', sep='\s+')
df=pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/\
auto-mpg/auto-mpg.data', delim_whitespace=True)