Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 从数据帧迭代文本行时出错_Python_Python 3.x_Pandas - Fatal编程技术网

Python 从数据帧迭代文本行时出错

Python 从数据帧迭代文本行时出错,python,python-3.x,pandas,Python,Python 3.x,Pandas,我在尝试迭代包含自由文本的pandas数据帧中的序列时遇到错误。文本包含在df[1]中 import pandas as pd corpus = [] for i in range(0, 1000): review = df[1][i] 引发的错误位于代码的最后一行 除了KeyError作为e1外:如果len(self)>0并且self.u在['integer','boolean']中键入:。。。 关键字错误:100 尽管进行了搜索,但我无法理解错误消息的含义 编辑 我意识到这个错误不

我在尝试迭代包含自由文本的pandas数据帧中的序列时遇到错误。文本包含在
df[1]

import pandas as pd
corpus = []
for i in range(0, 1000):
    review = df[1][i]
引发的错误位于代码的最后一行

除了KeyError作为e1外:如果len(self)>0并且self.u在['integer','boolean']中键入:。。。 关键字错误:100

尽管进行了搜索,但我无法理解错误消息的含义

编辑
我意识到这个错误不是由正则表达式引起的,所以我已经排除了对正则表达式的所有引用。错误与上面显示的代码相同

使用循环被认为是熊猫中最不理想的选择。请查看df.replace()

以这个数据帧为例

df = pd.DataFrame({'col': ['sgra834', '%^$asgsg', '23hgfh*', 'sfg343^%adf']})

    col
0   sgra834
1   %^$asgsg
2   23hgfh*
3   sfg343^%adf
您可以使用replace

df.replace('[^a-zA-Z]', '', regex = True)
你得到

    col
0   sgra
1   asgsg
2   hgfh
3   sfgadf

在熊猫中,使用循环被认为是最不理想的选择。请查看df.replace()。您可以尝试类似df.replace(“[^a-zA-Z]”,“,regex=True)@Bharath,done:)