Python 读取TXT或CSV或XLS或XLSX的第一列
我需要将文档的第一列解析为列表['item1','item2',…],此文档可以是: 用换行符分隔的TXT文档项 只有一列的CSV文档与TXT文档类似 包含多个列的CSV,以分隔; 包含多个列的CSV,由, 具有一列或多列的XLS 具有一列或多列的XLSX 我准备用许多案例来编写代码:Python 读取TXT或CSV或XLS或XLSX的第一列,python,excel,csv,xlsx,xls,Python,Excel,Csv,Xlsx,Xls,我需要将文档的第一列解析为列表['item1','item2',…],此文档可以是: 用换行符分隔的TXT文档项 只有一列的CSV文档与TXT文档类似 包含多个列的CSV,以分隔; 包含多个列的CSV,由, 具有一列或多列的XLS 具有一列或多列的XLSX 我准备用许多案例来编写代码: ext = os.path.splitext(f)[1].lower() if ext == '.txt': with open(f, 'r') as f: L = f.read().sp
ext = os.path.splitext(f)[1].lower()
if ext == '.txt':
with open(f, 'r') as f:
L = f.read().splitlines()
if ext == '.csv':
reader = csv.reader(...)
...
if ext == '.xls':
...
但是Python中是否有一个通用的高级工具可以直接完成所有这些工作?该库是一个高级抽象,需要使用一致的接口处理不同格式的数据文件:
pyexcel提供了一个应用程序编程接口来读取,
以不同的excel格式操作和写入数据。这个图书馆
使涉及excel文件的信息处理成为一项令人愉快的任务。
excel文件中的数据可以用最少的时间转换为数组或dict
代码,反之亦然。该库侧重于使用excel进行数据处理
文件作为存储介质,因此字体、颜色和图表不是
将不予考虑
下面给出了一个简单的用法示例:
>>> import pyexcel as pe
>>> records = pe.iget_records(file_name="your_file.xls")
>>> for record in records:
... print("%s is aged at %d" % (record['Name'], record['Age']))
在线提供了许多导入/导出库。我发现它特别有趣,尽管它适用于C语言,但基本上也适用相同的原则。你可以看看这个库。@MartinEvans,这看起来很有趣。有很多变体:PyExcelIO、PyExcelXLS等。您想用它发布答案吗?