如何在Python上收集句子中的特定单词?
我在标题上写着一个问题。我会举例说明 有一个txt文件,看起来像 这一罪行的结束是有原因的:没有问题。注:没有 可疑情况。u0t9231 2018年3月21日10:38:46 这一罪行的结束是有原因的:没有问题。注:预计 交通。u0t9231 2018年3月21日14:20:11 我想读那个txt文件,我想写另一个文件,其中只包含“注意:没有可疑情况”的一部分 因此输入如何在Python上收集句子中的特定单词?,python,Python,我在标题上写着一个问题。我会举例说明 有一个txt文件,看起来像 这一罪行的结束是有原因的:没有问题。注:没有 可疑情况。u0t9231 2018年3月21日10:38:46 这一罪行的结束是有原因的:没有问题。注:预计 交通。u0t9231 2018年3月21日14:20:11 我想读那个txt文件,我想写另一个文件,其中只包含“注意:没有可疑情况”的一部分 因此输入 Notes: There is no suspicious situation 这一罪行的结束是有原因的:没有问题。注:无可
Notes: There is no suspicious situation
这一罪行的结束是有原因的:没有问题。注:无可疑情况。u0t9231 2018年3月21日10:38:46“
输出
Notes: There is no suspicious situation
你应该做的第一件事是把它分成几个句子。这可以通过在句号处拆分将字符串拆分成一个列表来完成。如果你只需要notes部分,那么在你刚刚拆分的句子中执行迭代搜索,寻找关键字“notes”
此函数将能够对给定的句子求值,然后返回所需的信息。您可以使用“拆分”,但这只适用于单个字符的分词表。使用正则表达式可以使用单词而不是分词表来更具体地描述您要查找的单词
import re
line='This offense was closed with reason: Non-Issue. Notes: There is no suspicious situation. u0t9231 21 Mar 2018 10:38:46'
found = re.search('Notes:.*', line)
print found.group(0)
输出:
注意:预期流量。u0t9231 2018年3月21日14:20:11。您是否已经在第二个文件中查找您已经拥有的内容。我不理解该用例;您可以只读取第二个文件而不是.PS。如果您想要一个只包含“注意:没有可疑情况”的文件“然后创建包含此文本的文件。你不需要任何输入文件。那么你的代码在哪里?你必须详细解释为什么“注意:没有可疑情况”是你想要得到的输出。在标题中,你说你想“收集特定单词”,但这看起来更像是在搜索包含特定单词的句子。不清楚你的代码应该做什么。您还没有发布任何代码-我们希望寻求帮助者至少尝试解决此问题。