Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/301.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
我有两段文字。我必须使用python nltk从这两个段落中找到常用词_Python_Machine Learning_Nlp_Artificial Intelligence_Nltk - Fatal编程技术网

我有两段文字。我必须使用python nltk从这两个段落中找到常用词

我有两段文字。我必须使用python nltk从这两个段落中找到常用词,python,machine-learning,nlp,artificial-intelligence,nltk,Python,Machine Learning,Nlp,Artificial Intelligence,Nltk,第1段 电子商务,通常被称为电子商务,是利用计算机网络(如互联网或在线社交网络)进行商品或服务交易或促进交易的过程。电子商务利用了移动商务、电子资金转移、供应链管理、互联网营销、在线交易处理、电子数据交换(EDI)、库存管理系统和自动数据收集系统等技术 第2段 现代电子商务通常在交易生命周期的至少一部分使用万维网,但也可能使用电子邮件等其他技术。电子商务的好处包括它的访问速度、更广泛的商品和服务选择、可访问性和国际影响力 我必须在两个段落之间找到共同的词并打印出来,你可以使用 如果您不需要在语言

第1段

电子商务,通常被称为电子商务,是利用计算机网络(如互联网或在线社交网络)进行商品或服务交易或促进交易的过程。电子商务利用了移动商务、电子资金转移、供应链管理、互联网营销、在线交易处理、电子数据交换(EDI)、库存管理系统和自动数据收集系统等技术

第2段

现代电子商务通常在交易生命周期的至少一部分使用万维网,但也可能使用电子邮件等其他技术。电子商务的好处包括它的访问速度、更广泛的商品和服务选择、可访问性和国际影响力

我必须在两个段落之间找到共同的词并打印出来,你可以使用


如果您不需要在语言处理方面做一些特殊的事情,那么您不需要NLTK:

paragraph1 = paragraph1.lower().split()
paragraph2 = paragraph2.lower().split()

intersection = set(words1) & set(words2)

谢谢你的回复,但我想在nltk这个。还要感谢you@BhatiManishKumar我不知道有任何NLTK方法可以达到相同的结果。如果您检查了,他们也经常使用set.intersection()来获得类似的结果。@BhatiManishKumar当您开始抛出不合理的约束并敲响警钟时-这很可能是家庭作业或项目,否则,就没有理由安装50MB库来完成通过简单的集合交集可以实现的任务。您不太可能在这里找到帮助。@BhatiManishKumar,更改您的用户ID以隐藏您的姓名也敲响了警钟。问家庭作业问题并不违反本网站的规定,只要它们是好问题。你已经有了足够的提示,现在去学习一些Python。这听起来像是一个家庭作业问题,所以我不提供答案,而是给你一个提示。NLTK本身无法做到这一点——这不是NLTK的目的。但是,您最可能需要做的是使用NLTK的标记器将段落拆分为单词,然后将这些单词放入集合并进行比较(例如,通过建议答案的建议)。步骤1
nltk.word_tokenize
,步骤2:查看或尝试@BhatiManishKumar中的任何方法,更改您的用户ID以隐藏您的姓名也会敲响警钟。问家庭作业问题并不违反本网站的规定,只要它们是好问题。您已经得到了足够的提示,现在去学习一些Python。
paragraph1 = paragraph1.lower().split()
paragraph2 = paragraph2.lower().split()

intersection = set(words1) & set(words2)