Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/278.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 从查询字符串中提取数据帧列名_Python_Pandas_String_Extract - Fatal编程技术网

Python 从查询字符串中提取数据帧列名

Python 从查询字符串中提取数据帧列名,python,pandas,string,extract,Python,Pandas,String,Extract,我有一个包含很多字段的数据集,所以我不想将所有字段都加载到pd.DataFrame,而只加载基本字段 有时,我希望在加载时进行一些过滤,并希望通过query或eval方法应用过滤器,这意味着我需要一个形式为的查询字符串,即“概率>10和距离我想你可以在加载数据帧时使用术语use cols我在加载csv时使用它我不知道在使用SQL或其他格式时这是可能的 要使用的列=['Column1','Column3'] pd.read\u csv(使用列=要使用的列…) 谢谢数据来自哪里,SQL?来自拼花地板

我有一个包含很多字段的数据集,所以我不想将所有字段都加载到
pd.DataFrame
,而只加载基本字段


有时,我希望在加载时进行一些过滤,并希望通过
query
eval
方法应用过滤器,这意味着我需要一个形式为的查询字符串,即
“概率>10和距离我想你可以在加载数据帧时使用术语use cols我在加载csv时使用它我不知道在使用SQL或其他格式时这是可能的

要使用的列=['Column1','Column3'] pd.read\u csv(使用列=要使用的列…)


谢谢

数据来自哪里,SQL?来自拼花地板数据集所以你想从你的
蜂巢
查询中获取列名?实际上,在我进行
df.query
调用时,所有内容都已经是dataframe格式。这个过程是这样的,我从磁盘上的拼花地板启动一个pyarrow数据集。在pyarrow数据集上,我可以调用
to_表(columns=my_columns)
,然后调用
to_pandas()
,但我已经需要知道从外部提供的查询字符串中,
my_columns
是什么,然后将其应用于dataframe对象,它应该已经包含查询工作所需的特定列。谢谢,这实际上是我当前的解决方案,但我想知道是否可以从字符串本身推断要使用的列。