Azure Blob SDK(Python Azure存储Blob)不解析带有制表符分隔列的行

Azure Blob SDK(Python Azure存储Blob)不解析带有制表符分隔列的行,python,azure,azure-storage-blobs,Python,Azure,Azure Storage Blobs,我在Azure Blob存储中有Microsoft Academic Graph推送的.txt文件。 文件中的每一行代表一个对象,对应于以下架构: 我正在使用Azure Blob SDK for Python来使用BlobClient类(特别是query_Blob方法)搜索条目,如下所述: 当我将它用于.csv文件时,一切都正常工作,它可以按值搜索大文件中的特定列,并返回符合SQL查询条件的唯一条目 但是,当我在.txt文件中使用它进行搜索时,它拒绝将行解析为列,并将整行作为单个列返回。 我

我在Azure Blob存储中有Microsoft Academic Graph推送的.txt文件。 文件中的每一行代表一个对象,对应于以下架构:

我正在使用Azure Blob SDK for Python来使用BlobClient类(特别是query_Blob方法)搜索条目,如下所述:

当我将它用于.csv文件时,一切都正常工作,它可以按值搜索大文件中的特定列,并返回符合SQL查询条件的唯一条目

但是,当我在.txt文件中使用它进行搜索时,它拒绝将行解析为列,并将整行作为单个列返回。 我做了一系列测试,并注意到当我使用

分隔符='\t'

分隔符='\t'

分隔符='/\t'

delimiter=b'\t'-这将引发一个错误

分隔符='\t\t\t\t\t\t'

我还尝试了其他一些选择:

分隔符='\tt'

分隔符='\t\t\tt'

无论有多少个“\t”符号,这些符号都以“t”字母分隔每一行。 看起来“\t”只是从“delimiter”参数中筛选出来,因此完全被忽略

我只是想找到一种方法,如何像往常一样使用那些“每行中以tab分隔的列”的文件。csv文件中的列以逗号分隔

这些文件相当大(有些只有几GB,有些大约100GB),因此,仅仅编辑这些文件似乎不是一个好的选择。 此外,文件会自动更新,并且应该自动解析

我做错了什么?为什么忽略该“\t”符号,以及如何在列之间用“\t”符号分隔时正确解析文件