Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby-on-rails-4/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 您好,正在尝试提取名称+;从文本文件和don';I don’我不知道如何把输出放在一起_Python_Extraction - Fatal编程技术网

Python 您好,正在尝试提取名称+;从文本文件和don';I don’我不知道如何把输出放在一起

Python 您好,正在尝试提取名称+;从文本文件和don';I don’我不知道如何把输出放在一起,python,extraction,Python,Extraction,我试图将我的数据、姓名和电子邮件并排输出。现在它只打印电子邮件,然后是姓名 这是我的代码: 重新导入 导入nltk 从nltk.corpus导入停止词 stop=stopwords.words('english') inputfile=open('/Users/jchome/Downloads/StockXRF/untitled.txt',r') string=inputfile.read() def提取电子邮件地址(字符串): r=重新编译(r'[\w\.-]+@[\w\.-]+') 返回r.

我试图将我的数据、姓名和电子邮件并排输出。现在它只打印电子邮件,然后是姓名

这是我的代码:

重新导入
导入nltk
从nltk.corpus导入停止词
stop=stopwords.words('english')
inputfile=open('/Users/jchome/Downloads/StockXRF/untitled.txt',r')
string=inputfile.read()
def提取电子邮件地址(字符串):
r=重新编译(r'[\w\.-]+@[\w\.-]+')
返回r.findall(字符串)
def ie_预处理(文档):
document=''.join([i代表document.split()中的i,如果我不在stop中])
句子=nltk.sent\u标记化(文档)
句子=[nltk.word_标记化(sent)表示已发送的句子]
句子=[nltk.pos_标记(已发送)表示已发送的句子]
复句
def摘录_名称(文档):
名称=[]
句子=ie_预处理(文档)
对于句子中的带标记的句子:
对于nltk.ne_chunk中的chunk(带标记的_语句):
如果类型(块)==nltk.tree.tree:
如果chunk.label()=“PERSON”:
names.append(“”.join([c[0]表示块中的c]))
返回名称
如果uuuu name uuuuuu='\uuuuuuu main\uuuuuuu':
电子邮件=提取电子邮件地址(字符串)
名称=提取名称(字符串)
打印(电子邮件+姓名)
输出:

['1lawrencenage1l@gmail.com', george@gmail.com,“劳伦斯”,“乔治”]


如何将输出相邻放置并写入文本文件?

您可以执行以下操作:

import pandas as pd
zipped = list(zip(emails, names))
df = pd.DataFrame(zipped, columns = ['emails' , 'names'])

在此之后,您可以打印数据帧,并可以使用例如将输出保存到文件的方法。

获取此错误的可能重复:回溯(最近一次调用):文件“/Applications/Temp/stockxnltk4.py”,第41行,在df=pd.DataFrame(压缩,列=['emails','names'])NameError:name'pd'未定义您需要先导入pandas才能使用此函数将熊猫作为pd导入应该可以解决您的问题;)