Python 按字母顺序计数单词_Python_Text_Nlp_Processing

Python 按字母顺序计数单词

python text nlp processing

Python 按字母顺序计数单词,python,text,nlp,processing,Python,Text,Nlp,Processing,在文本处理任务中，首先要做的事情之一是计算每个单词在给定文档中出现的频率。在本任务中，您将完成一个函数，该函数返回标记化word文档的唯一词频编写代码以完成计数频率功能。输入参数arr是字符串列表，表示标记化的word文档。示例输入如下所示： [“狗”，“得到”，“骨头”] count_frequencies函数应返回一个元组列表，其中元组中的第一个元素是arr中的唯一单词，元组中的第二个元素是它在arr中出现的频率。返回的列表应按每个元组的第一个元素的字母顺序排序。对于上面的示例，正确的输出

在文本处理任务中，首先要做的事情之一是计算每个单词在给定文档中出现的频率。在本任务中，您将完成一个函数，该函数返回标记化word文档的唯一词频

编写代码以完成计数频率功能。输入参数arr是字符串列表，表示标记化的word文档。示例输入如下所示：

[“狗”，“得到”，“骨头”]

count_frequencies函数应返回一个元组列表，其中元组中的第一个元素是arr中的唯一单词，元组中的第二个元素是它在arr中出现的频率。返回的列表应按每个元组的第一个元素的字母顺序排序。对于上面的示例，正确的输出将是以下元组列表：

**[('bone', 1), ('dog', 1), ('got', 1), ('the', 2)]**

下面显示了更多具有解决方案的示例：

**Input: ['we', 'came', 'we', 'saw', 'we', 'conquered']**
**Solution: [('came', 1), ('conquered', 1), ('saw', 1), ('we', 3)]**
**Input: ['a', 'square', 'is', 'a', 'rectangle']**
**Solution: [('a', 2), ('is', 1), ('rectangle', 1), ('square', 1)]**

您可以在输入文本框中编写自己的测试用例。

在这种情况下，您的测试用例应该是空格分隔的单词，表示count_frequencies函数的输入列表。

您可以使用以下方法使用此简单函数：

完美的解决方案，但作为一名教师，我会给它零分@安莫尔，因为你把作业丢到了学校。你还没有发布你已经尝试过的东西，如果你被困在某个地方。在得到答案后，你甚至还没有选择它并结束这个问题。这实际上并没有产生你声称的输出。你在任何地方都没有按计数排序，而你声称的输出是列出最常见返回的单词的计数器。好的是，实际产出是OP最初要求的。完美的解决方案，但作为一名教师，我会给它零分@安莫尔，因为你把作业丢到了学校。你还没有发布你已经尝试过的东西，如果你被困在某个地方。在得到答案后，你甚至还没有选择它并结束这个问题。这实际上并没有产生你声称的输出。你在任何地方都没有按计数排序，而你声称的输出是列出最常见返回的单词的计数器。好消息是，实际产出是OP最初要求的。请阅读

from collections import Counter

def count_words(list_of_words):
    return sorted(Counter(list_of_words).items())

>>> count_words(['we', 'came', 'we', 'saw', 'we', 'conquered'])

# [('came', 1), ('conquered', 1), ('saw', 1), ('we', 3)]