Python 熊猫值误差_Python_Pandas_Statsmodels

Python 熊猫值误差

python pandas

Python 熊猫值误差,python,pandas,statsmodels,Python,Pandas,Statsmodels,错误：ValueError：对偏差函数的第一次猜测返回了一个nan。这可能是一个边界问题，应予以报告从csv文件列引入的数据： from __future__ import print_function import statsmodels.api as sm import statsmodels.formula.api as smf import pandas as pd import pandas df = pandas.read_csv("volvo_volvo.csv"); dfw

错误：ValueError：对偏差函数的第一次猜测返回了一个nan。这可能是一个边界问题，应予以报告

从csv文件列引入的数据：

from __future__ import print_function
import statsmodels.api as sm
import statsmodels.formula.api as smf
import pandas as pd
import pandas

df = pandas.read_csv("volvo_volvo.csv");
dfw = pandas.DataFrame(data = df, columns=['x','y'])
y = df.y.values
x = df.x.values

data = pd.DataFrame({'x' : x, 'y' : y}) #to merge the two side by side
print(data)

formula = 'y ~ x'

mod1 = smf.glm(formula=formula, data=data, family=sm.families.Binomial()).fit()
x = mod1.summary()

print(x)

请提供完整的错误回溯，因为不清楚代码的哪一行引发此异常。我猜想这是一行：

y=df.y.values

出于好奇：

df

、

dfw

和

数据帧之间有什么区别？你的y值是什么？与前面的问题有什么不同？我的数据现在来自csv@MaxU，添加了正在输入的数据，嗯，不知道有什么区别，我只知道它们可以工作，哈哈，对不起
        x      y
0   50000  16000
1   43000  15000
2   32424  18299
3   92821  14000
4   50392  19000
5   23941  19521
6   29201  20192
7   50192  15291
8   30201  19392
9   20591  18282
10  50401  19294
11  69401  16263
12  22124  16392
13  14940  19583