Python 按字母顺序计数单词

Python 按字母顺序计数单词,python,text,nlp,processing,Python,Text,Nlp,Processing,在文本处理任务中,首先要做的事情之一是计算每个单词在给定文档中出现的频率。在本任务中,您将完成一个函数,该函数返回标记化word文档的唯一词频 编写代码以完成计数频率功能。输入参数arr是字符串列表,表示标记化的word文档。示例输入如下所示: [“狗”,“得到”,“骨头”] count_frequencies函数应返回一个元组列表,其中元组中的第一个元素是arr中的唯一单词,元组中的第二个元素是它在arr中出现的频率。返回的列表应按每个元组的第一个元素的字母顺序排序。对于上面的示例,正确的输出

在文本处理任务中,首先要做的事情之一是计算每个单词在给定文档中出现的频率。在本任务中,您将完成一个函数,该函数返回标记化word文档的唯一词频

编写代码以完成计数频率功能。输入参数arr是字符串列表,表示标记化的word文档。示例输入如下所示:

[“狗”,“得到”,“骨头”]

count_frequencies函数应返回一个元组列表,其中元组中的第一个元素是arr中的唯一单词,元组中的第二个元素是它在arr中出现的频率。返回的列表应按每个元组的第一个元素的字母顺序排序。对于上面的示例,正确的输出将是以下元组列表:

**[('bone', 1), ('dog', 1), ('got', 1), ('the', 2)]**
下面显示了更多具有解决方案的示例:

**Input: ['we', 'came', 'we', 'saw', 'we', 'conquered']**
**Solution: [('came', 1), ('conquered', 1), ('saw', 1), ('we', 3)]**
**Input: ['a', 'square', 'is', 'a', 'rectangle']**
**Solution: [('a', 2), ('is', 1), ('rectangle', 1), ('square', 1)]**
您可以在输入文本框中编写自己的测试用例。
在这种情况下,您的测试用例应该是空格分隔的单词,表示count_frequencies函数的输入列表。

您可以使用以下方法使用此简单函数:


您可以使用以下方法使用此简单函数:


完美的解决方案,但作为一名教师,我会给它零分@安莫尔,因为你把作业丢到了学校。你还没有发布你已经尝试过的东西,如果你被困在某个地方。在得到答案后,你甚至还没有选择它并结束这个问题。这实际上并没有产生你声称的输出。你在任何地方都没有按计数排序,而你声称的输出是列出最常见返回的单词的计数器。好的是,实际产出是OP最初要求的。完美的解决方案,但作为一名教师,我会给它零分@安莫尔,因为你把作业丢到了学校。你还没有发布你已经尝试过的东西,如果你被困在某个地方。在得到答案后,你甚至还没有选择它并结束这个问题。这实际上并没有产生你声称的输出。你在任何地方都没有按计数排序,而你声称的输出是列出最常见返回的单词的计数器。好消息是,实际产出是OP最初要求的。请阅读
from collections import Counter

def count_words(list_of_words):
    return sorted(Counter(list_of_words).items())

>>> count_words(['we', 'came', 'we', 'saw', 'we', 'conquered'])

# [('came', 1), ('conquered', 1), ('saw', 1), ('we', 3)]