如何使用绘图在Python中执行univaraiate分析
我在下面有一个数据集,我想对如何使用绘图在Python中执行univaraiate分析,python,pandas,numpy,matplotlib,seaborn,Python,Pandas,Numpy,Matplotlib,Seaborn,我在下面有一个数据集,我想对收入类别进行单变量分析,如图所示。这里的点在数字类别中1被视为男性,0被视为女性 有什么办法可以解决这个问题吗 Income Population Number Category 54 77 1 A 23 88 1 A 44 87 0 B 55 88 0 B 66 8
收入
类别
进行单变量分析,如图所示。这里的点在数字类别中1
被视为男性
,0
被视为女性
有什么办法可以解决这个问题吗
Income Population Number Category
54 77 1 A
23 88 1 A
44 87 0 B
55 88 0 B
66 89 1 B
73 90 0 A
12 89 1 C
34 9 0 C
54 77 1 A
23 88 1 A
44 87 0 B
55 88 0 B
66 89 1 B
73 90 0 A
12 89 1 C
34 9 0 C
我不确定你的问题是否清楚。但是,以下曲线图通常用于进行单变量和双变量分析
import seaborn as sns
import numpy as np
import pandas as pd
df = pd.DataFrame({'Income': [54,23,44,55,66,],
'Population':[77,88,87,88,89],
'Number':[1,1,0,0],
'Category':['A','A','B','B','C']})
### Univariate analysis
sns.distplot(df.Income) # numeric
sns.boxplot(df.Income) # numeric
sns.distplot(df.Population)
sns.countplot(df.Category) # categorical
sns.countplot(df.Number)
## Bivariate analysis
sns.jointplot('Income', 'Population', data = df, kind='scatter')
sns.lmplot(df.Income, df.Population, data=df, hue='Number', fit_reg=False)
sns.countplot(Category, hue = 'Number', data=df)
## Multivariate analysis
sns.pairplot(df.select_dtypes(include=[np.int, np.float]])
我不确定你的问题是否清楚。但是,以下曲线图通常用于进行单变量和双变量分析
import seaborn as sns
import numpy as np
import pandas as pd
df = pd.DataFrame({'Income': [54,23,44,55,66,],
'Population':[77,88,87,88,89],
'Number':[1,1,0,0],
'Category':['A','A','B','B','C']})
### Univariate analysis
sns.distplot(df.Income) # numeric
sns.boxplot(df.Income) # numeric
sns.distplot(df.Population)
sns.countplot(df.Category) # categorical
sns.countplot(df.Number)
## Bivariate analysis
sns.jointplot('Income', 'Population', data = df, kind='scatter')
sns.lmplot(df.Income, df.Population, data=df, hue='Number', fit_reg=False)
sns.countplot(Category, hue = 'Number', data=df)
## Multivariate analysis
sns.pairplot(df.select_dtypes(include=[np.int, np.float]])
如果将数据放入pandas数据框中,则可以轻松地将男性和女性的值分开,例如(仅使用
收入和数字):
然后,您可以使用以下示例绘制条形图:。plot.ly软件包也很适合这种情况,如示例所示。如果将数据放入熊猫数据框中,则可以轻松地将男性和女性的值分开,例如(只需使用收入
和数字
):
然后,您可以使用以下示例绘制条形图:。plot.ly包也很适合这种类型的东西,如示例中所示。您有什么问题吗?我无法将1
作为男性
和0
作为女性
分开,并为不同的变量绘制以下图表。请将数据集放在数据框中。例如,你可以阅读,它会帮助你。要区分男性和女性,你需要学习。例如,您可以执行df[df.Number==1]
只使用Male
获得数据框
,然后绘制您想要的任何图形。您有什么问题?我无法将1
作为Male
和0
作为女性
分开,并为不同的变量绘制以下图形。请将数据集放入数据框
。例如,你可以阅读,它会帮助你。要区分男性和女性,你需要学习。例如,您可以使用df[df.Number==1]
获得一个只有Male
的DataFrame
,然后绘制您想要的任何内容。