Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/324.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用绘图在Python中执行univaraiate分析_Python_Pandas_Numpy_Matplotlib_Seaborn - Fatal编程技术网

如何使用绘图在Python中执行univaraiate分析

如何使用绘图在Python中执行univaraiate分析,python,pandas,numpy,matplotlib,seaborn,Python,Pandas,Numpy,Matplotlib,Seaborn,我在下面有一个数据集,我想对收入类别进行单变量分析,如图所示。这里的点在数字类别中1被视为男性,0被视为女性 有什么办法可以解决这个问题吗 Income Population Number Category 54 77 1 A 23 88 1 A 44 87 0 B 55 88 0 B 66 8

我在下面有一个数据集,我想对
收入
类别
进行单变量分析,如图所示。这里的点在数字类别中
1
被视为
男性
0
被视为
女性

有什么办法可以解决这个问题吗

Income  Population  Number  Category
54        77           1       A
23        88           1       A
44        87           0       B
55        88           0       B
66        89           1       B
73        90           0       A
12        89           1       C
34        9            0       C
54        77           1       A
23        88           1       A
44        87           0       B
55        88           0       B
66        89           1       B
73        90           0       A
12        89           1       C
34        9            0       C

我不确定你的问题是否清楚。但是,以下曲线图通常用于进行单变量和双变量分析

import seaborn as sns
import numpy as np
import pandas as pd

df = pd.DataFrame({'Income': [54,23,44,55,66,],
                   'Population':[77,88,87,88,89],
                   'Number':[1,1,0,0],
                   'Category':['A','A','B','B','C']})

### Univariate analysis
sns.distplot(df.Income) # numeric
sns.boxplot(df.Income) # numeric
sns.distplot(df.Population)
sns.countplot(df.Category) # categorical
sns.countplot(df.Number)

## Bivariate analysis
sns.jointplot('Income', 'Population', data = df, kind='scatter')
sns.lmplot(df.Income, df.Population, data=df, hue='Number', fit_reg=False)
sns.countplot(Category, hue = 'Number', data=df)

## Multivariate analysis
sns.pairplot(df.select_dtypes(include=[np.int, np.float]])

我不确定你的问题是否清楚。但是,以下曲线图通常用于进行单变量和双变量分析

import seaborn as sns
import numpy as np
import pandas as pd

df = pd.DataFrame({'Income': [54,23,44,55,66,],
                   'Population':[77,88,87,88,89],
                   'Number':[1,1,0,0],
                   'Category':['A','A','B','B','C']})

### Univariate analysis
sns.distplot(df.Income) # numeric
sns.boxplot(df.Income) # numeric
sns.distplot(df.Population)
sns.countplot(df.Category) # categorical
sns.countplot(df.Number)

## Bivariate analysis
sns.jointplot('Income', 'Population', data = df, kind='scatter')
sns.lmplot(df.Income, df.Population, data=df, hue='Number', fit_reg=False)
sns.countplot(Category, hue = 'Number', data=df)

## Multivariate analysis
sns.pairplot(df.select_dtypes(include=[np.int, np.float]])

如果将数据放入pandas数据框中,则可以轻松地将男性和女性的值分开,例如(仅使用
收入
数字
):


然后,您可以使用以下示例绘制条形图:。plot.ly软件包也很适合这种情况,如示例所示。

如果将数据放入熊猫数据框中,则可以轻松地将男性和女性的值分开,例如(只需使用
收入
数字
):


然后,您可以使用以下示例绘制条形图:。plot.ly包也很适合这种类型的东西,如示例中所示。

您有什么问题吗?我无法将
1
作为
男性
0
作为
女性
分开,并为不同的变量绘制以下图表。请将数据集放在
数据框中。例如,你可以阅读,它会帮助你。要区分男性和女性,你需要学习。例如,您可以执行
df[df.Number==1]
只使用
Male
获得
数据框
,然后绘制您想要的任何图形。您有什么问题?我无法将
1
作为
Male
0
作为
女性
分开,并为不同的变量绘制以下图形。请将数据集放入
数据框
。例如,你可以阅读,它会帮助你。要区分男性和女性,你需要学习。例如,您可以使用
df[df.Number==1]
获得一个只有
Male
DataFrame
,然后绘制您想要的任何内容。