Azure Blob SDK（Python Azure存储Blob）不解析带有制表符分隔列的行_Python_Azure_Azure Storage Blobs

Azure Blob SDK（Python Azure存储Blob）不解析带有制表符分隔列的行

python azure

Azure Blob SDK（Python Azure存储Blob）不解析带有制表符分隔列的行,python,azure,azure-storage-blobs,Python,Azure,Azure Storage Blobs,我在Azure Blob存储中有Microsoft Academic Graph推送的.txt文件。文件中的每一行代表一个对象，对应于以下架构：我正在使用Azure Blob SDK for Python来使用BlobClient类（特别是query_Blob方法）搜索条目，如下所述：当我将它用于.csv文件时，一切都正常工作，它可以按值搜索大文件中的特定列，并返回符合SQL查询条件的唯一条目但是，当我在.txt文件中使用它进行搜索时，它拒绝将行解析为列，并将整行作为单个列返回。我

我在Azure Blob存储中有Microsoft Academic Graph推送的.txt文件。文件中的每一行代表一个对象，对应于以下架构：

我正在使用Azure Blob SDK for Python来使用BlobClient类（特别是query_Blob方法）搜索条目，如下所述：

当我将它用于.csv文件时，一切都正常工作，它可以按值搜索大文件中的特定列，并返回符合SQL查询条件的唯一条目

但是，当我在.txt文件中使用它进行搜索时，它拒绝将行解析为列，并将整行作为单个列返回。我做了一系列测试，并注意到当我使用

分隔符='\t'

分隔符='/\t'

delimiter=b'\t'-这将引发一个错误

分隔符='\t\t\t\t\t\t'

我还尝试了其他一些选择：

分隔符='\tt'

分隔符='\t\t\tt'

无论有多少个“\t”符号，这些符号都以“t”字母分隔每一行。看起来“\t”只是从“delimiter”参数中筛选出来，因此完全被忽略

我只是想找到一种方法，如何像往常一样使用那些“每行中以tab分隔的列”的文件。csv文件中的列以逗号分隔

这些文件相当大（有些只有几GB，有些大约100GB），因此，仅仅编辑这些文件似乎不是一个好的选择。此外，文件会自动更新，并且应该自动解析

我做错了什么？为什么忽略该“\t”符号，以及如何在列之间用“\t”符号分隔时正确解析文件