Python-dataframe列值-列数据存储为列表(即“[this,that]”)
我试过很多不同的方法,我想我离这里很近。我有一个由Gensim关键字摘要器提供的研究摘要生成的单词列表。数据是准确的,但是它存储为每行的列表,我想去掉每行的['和']。我尝试了下面的代码和不同的变体,但要么我得到了一个错误,要么代码处理但没有替换。我试过:Python-dataframe列值-列数据存储为列表(即“[this,that]”),python,pandas,list,text,replace,Python,Pandas,List,Text,Replace,我试过很多不同的方法,我想我离这里很近。我有一个由Gensim关键字摘要器提供的研究摘要生成的单词列表。数据是准确的,但是它存储为每行的列表,我想去掉每行的['和']。我尝试了下面的代码和不同的变体,但要么我得到了一个错误,要么代码处理但没有替换。我试过: #scenario 1 keywords = ['screened', 'model', 'health', 'volume'] df['newnlpkeywords'] = keywords df['newnlpkeywords'
#scenario 1
keywords = ['screened', 'model', 'health', 'volume']
df['newnlpkeywords'] = keywords
df['newnlpkeywords'].replace("']", "", inplace=True)
及
我知道这是一个很难回答的问题,但我正在努力学习!我想经过30分钟的尝试,我应该寻求帮助。谢谢 这就是你要找的吗 将numpy作为np导入 进口稀土 rgx=λx:re.sub'],,x rgx=np.vectorizergx df['newnlpkeywords'].values=rgxdf['newnlpkeywords'].values 以下代码将rgx函数应用于df['newnlpkeywords']中的每一行
我知道可能有更多的python方法可以做到这一点,但这是一个快速解决方案,我相信有一个更整洁的答案您会得到什么输出以及您希望得到什么输出?假设newnlpkeywords是一个列表,而不是一个带括号的str类型,您可以执行df[newnlpkeywords]=df[newnlpkeywords].applylambda x:,.joinx。如果变量是str类型,那么您应该能够执行df[newnlpkeywords].str.replacer\[\124;\],我的输出就是列表,如['screen'、'model'、'health'、'volume']@brittenb-这很有效,谢谢!
#scenario 2
keywords = ['screened', 'model', 'health', 'volume']
df['newnlpkeywords'] = keywords.replace(replace("']", "")