Python 计算熵和信息增益

Python 计算熵和信息增益,python,python-3.x,decision-tree,entropy,information-gain,Python,Python 3.x,Decision Tree,Entropy,Information Gain,我是python的初学者,尝试在不使用任何库的情况下计算熵和信息增益。目前,计算结果比代码质量更重要 我有一个数据框,希望像这样列出属性计数 Outlook = [ [4, 0], # overcast [2, 3], # sunny [3, 2] # rain ] temperature = [ [2, 2], # hot [3, 1], # cool [4, 2] # mild ] 这是我的数据: 我不明白你的问题。我不知道那

我是python的初学者,尝试在不使用任何库的情况下计算熵和信息增益。目前,计算结果比代码质量更重要

我有一个数据框,希望像这样列出属性计数

Outlook = [
    [4, 0],  # overcast
    [2, 3],  # sunny
    [3, 2]   # rain
]
temperature = [
    [2, 2],  # hot
    [3, 1],  # cool
    [4, 2]   # mild
]
这是我的数据:

我不明白你的问题。我不知道那些坐标是什么,或者你怎么去那里。我不知道那个数据集到底是什么。努比?SQL?json?最后,我看不到任何代码。你看到数据集图像了吗?我不知道该编写什么代码。数据集采用cvs文件格式。一个非常基本的。Outlook=[[4,0],#阴天]这意味着有4个Cloud实例与属性outlook的yes对比,0个Cloud实例与属性outlook的no对比。你应该开始阅读关于CSV的文档:我想你会发现这些示例与你想做的非常相似。在那里找不到任何内容。我将cvs文件放在一个数据帧中,现在我必须“计数”属性值