Python 从数据帧迭代文本行时出错
我在尝试迭代包含自由文本的pandas数据帧中的序列时遇到错误。文本包含在Python 从数据帧迭代文本行时出错,python,python-3.x,pandas,Python,Python 3.x,Pandas,我在尝试迭代包含自由文本的pandas数据帧中的序列时遇到错误。文本包含在df[1]中 import pandas as pd corpus = [] for i in range(0, 1000): review = df[1][i] 引发的错误位于代码的最后一行 除了KeyError作为e1外:如果len(self)>0并且self.u在['integer','boolean']中键入:。。。 关键字错误:100 尽管进行了搜索,但我无法理解错误消息的含义 编辑 我意识到这个错误不
df[1]
中
import pandas as pd
corpus = []
for i in range(0, 1000):
review = df[1][i]
引发的错误位于代码的最后一行
除了KeyError作为e1外:如果len(self)>0并且self.u在['integer','boolean']中键入:。。。
关键字错误:100
尽管进行了搜索,但我无法理解错误消息的含义
编辑
我意识到这个错误不是由正则表达式引起的,所以我已经排除了对正则表达式的所有引用。错误与上面显示的代码相同 使用循环被认为是熊猫中最不理想的选择。请查看df.replace() 以这个数据帧为例
df = pd.DataFrame({'col': ['sgra834', '%^$asgsg', '23hgfh*', 'sfg343^%adf']})
col
0 sgra834
1 %^$asgsg
2 23hgfh*
3 sfg343^%adf
您可以使用replace
df.replace('[^a-zA-Z]', '', regex = True)
你得到
col
0 sgra
1 asgsg
2 hgfh
3 sfgadf
在熊猫中,使用循环被认为是最不理想的选择。请查看df.replace()。您可以尝试类似df.replace(“[^a-zA-Z]”,“,regex=True)@Bharath,done:)