Python 读取TXT或CSV或XLS或XLSX的第一列

Python 读取TXT或CSV或XLS或XLSX的第一列,python,excel,csv,xlsx,xls,Python,Excel,Csv,Xlsx,Xls,我需要将文档的第一列解析为列表['item1','item2',…],此文档可以是: 用换行符分隔的TXT文档项 只有一列的CSV文档与TXT文档类似 包含多个列的CSV,以分隔; 包含多个列的CSV,由, 具有一列或多列的XLS 具有一列或多列的XLSX 我准备用许多案例来编写代码: ext = os.path.splitext(f)[1].lower() if ext == '.txt': with open(f, 'r') as f: L = f.read().sp

我需要将文档的第一列解析为列表['item1','item2',…],此文档可以是:

用换行符分隔的TXT文档项 只有一列的CSV文档与TXT文档类似 包含多个列的CSV,以分隔; 包含多个列的CSV,由, 具有一列或多列的XLS 具有一列或多列的XLSX 我准备用许多案例来编写代码:

ext = os.path.splitext(f)[1].lower()
if ext == '.txt':
    with open(f, 'r') as f:
        L = f.read().splitlines()
if ext == '.csv':
    reader = csv.reader(...)
    ...
if ext == '.xls':
    ...
但是Python中是否有一个通用的高级工具可以直接完成所有这些工作?

该库是一个高级抽象,需要使用一致的接口处理不同格式的数据文件:

pyexcel提供了一个应用程序编程接口来读取, 以不同的excel格式操作和写入数据。这个图书馆 使涉及excel文件的信息处理成为一项令人愉快的任务。 excel文件中的数据可以用最少的时间转换为数组或dict 代码,反之亦然。该库侧重于使用excel进行数据处理 文件作为存储介质,因此字体、颜色和图表不是 将不予考虑

下面给出了一个简单的用法示例:

>>> import pyexcel as pe
>>> records = pe.iget_records(file_name="your_file.xls")
>>> for record in records:
...     print("%s is aged at %d" % (record['Name'], record['Age']))

在线提供了许多导入/导出库。我发现它特别有趣,尽管它适用于C语言,但基本上也适用相同的原则。你可以看看这个库。@MartinEvans,这看起来很有趣。有很多变体:PyExcelIO、PyExcelXLS等。您想用它发布答案吗?