Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/318.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 熊猫获得平均值并删除重复项_Python_Pandas_Dataframe - Fatal编程技术网

Python 熊猫获得平均值并删除重复项

Python 熊猫获得平均值并删除重复项,python,pandas,dataframe,Python,Pandas,Dataframe,我有以下数据帧: import pandas as pd df = pd.read_csv(...) 有人能告诉我如何做到这一点: A B x 3 y 5 z 2 1.删除C列 2.根据A列计算平均值 3.基于列A删除重复行 这是我第一次使用python,很抱歉垃圾邮件-我尝试使用其他答案,但没有任何效果 df = pd.DataFrame({"ali":["x","x","x","y&quo

我有以下数据帧:

import pandas as pd
df = pd.read_csv(...)

有人能告诉我如何做到这一点:

A  B
x  3
y  5
z  2
1.删除C列
2.根据A列计算平均值
3.基于列A删除重复行

这是我第一次使用python,很抱歉垃圾邮件-我尝试使用其他答案,但没有任何效果

df = pd.DataFrame({"ali":["x","x","x","y","y","z",'z'],"mali":[1,10,2,4,6,6,7]})

#output
    ali mali
0   x   1
1   x   10
2   x   2
3   y   4
4   y   6
5   z   6
6   z   7


df.groupby("ali")["mali"].mean()

ali
x    4.333333
y    5.000000
z    6.500000
Name: mali, dtype: float64
对于您的代码,这将是

df.groupby("A")["B"].mean()
尝试:


你试过什么?你可以在谷歌上输入“熊猫专栏”或“熊猫群和平均值”等快速搜索词,你会发现很多资源,包括官方文档。我试过:
https://stackoverflow.com/questions/39919570/pandas-calculating-the-mean-values-of-duplicate-entries-in-a-dataframe
这意味着您尝试使用的列不是int或float。要解决它,
df[“column”]=df[“column”]。\u numeric()
然后应用我发送给uIt的聚合是有意义的,但我不能将该方法
用于\u numeric()
<代码>!df1.groupby('code')[“range”]。to_numeric().mean()***AttributeError:'SeriesGroupBy'对象没有属性'to_numeric'重新阅读我告诉你的操作。。。我说在你重新分组之前先把这个列变成数字,好吧,我终于做到了。对不起,伙计,因为这件丑陋的事情,我太累了。对我来说太多python了:D谢谢你的时间!建议将“范围”重命名为其他名称。。。为python保留
df.groupby("A")["B"].mean()
import requests
url = 'https://gist.githubusercontent.com/AlbertKozera/6396b4333d1a9222193e11401069ed9a/raw/ab8733a2135bcf61999bbcac4f92e0de5fd56794/Pojazdy%2520elektryczne%2520w%2520USA.csv'
r = requests.get(url)

from io import StringIO
with StringIO(r.text) as sio:
    df = pd.read_csv(sio)


print(df.head(3))

x =df.drop(['state', 'brand', 'model', 'year of production', 'type'], axis=1)
df2 = df.groupby('code').range.mean()

print("\n GROUPBY State x Range (mean)")
print(df2.head())