Python中数据结构的选择

Python中数据结构的选择,python,data-structures,Python,Data Structures,我想处理此表单的数据: {red -> 1,5,6,7,5,11,...} {green -> 2,3,4,10,11,12,...} {blue -> 2,3,5,6,7,8,9,10,...} 其中颜色是关键点,数字是一些位置(非关键整数值) 我会有很多颜色和相关的数字 我想执行一些操作,比如颜色总数,前5种颜色中数字最多,等等 在Python中,您可以建议使用什么数据结构(存储键值和相关非键值项) 我知道这是一个广泛的问题。我正在努力解决这个问题,如果这有帮助的话 另外

我想处理此表单的数据:

{red -> 1,5,6,7,5,11,...}
{green -> 2,3,4,10,11,12,...}
{blue -> 2,3,5,6,7,8,9,10,...}
其中颜色是关键点,数字是一些位置(非关键整数值)

我会有很多颜色和相关的数字

我想执行一些操作,比如颜色总数,前5种颜色中数字最多,等等

Python
中,您可以建议使用什么
数据结构(存储键值和相关非键值项)

我知道这是一个广泛的问题。我正在努力解决这个问题,如果这有帮助的话

另外,我正在努力学习在线课程。这不是一个硬件。即使这是一个硬件,我想我的问题并不是在寻求解决方案

编辑

该数据集合包含许多小txt文件,其中包含一些文本。在数据结构中,最终我希望保存所有txt文件中的唯一单词,以及指向这些单词出现的documentid的指针

例:


你想要的几乎肯定是一本列表词典

data = {"red": [1, 5, 6, 7, 5, 11],
        "green": [2, 3, 4, 10, 11, 12],
        "blue": [2, 3, 5, 6, 7, 8, 9, 10],
        }
要获取颜色的总数,请执行以下操作:

number = len(data)
要按值的长度对字典进行排序,请执行以下操作:

sorted_colours = sorted(data, key=lambda x: len(data[x]), reverse=True)

但是您可能应该从集合模块中查看
defaultdict
orderedict
counter

A dict
d={“红色”:[1,5,…],“绿色”:[2,3,]等。}
(如果不需要重复的话,也可以设置值)不适合您的用例?这是一个过于宽泛且没有重点的问题(你说的“等”是什么意思?)我不知道,我是计算机科学的新手,这就是为什么我要问。如果你认为字典是个好主意,请作为答案发表,如果有的话,请附上备选答案。thanks@JohnColeman,谢谢,实际上我要先从很多文件中读一读。pasndas似乎对链接中的哪个问题比较合理ng?
sorted_colours = sorted(data, key=lambda x: len(data[x]), reverse=True)