Python 熊猫值误差
错误:ValueError:对偏差函数的第一次猜测返回了一个nan。这可能是一个边界问题,应予以报告 从csv文件列引入的数据:Python 熊猫值误差,python,pandas,statsmodels,Python,Pandas,Statsmodels,错误:ValueError:对偏差函数的第一次猜测返回了一个nan。这可能是一个边界问题,应予以报告 从csv文件列引入的数据: from __future__ import print_function import statsmodels.api as sm import statsmodels.formula.api as smf import pandas as pd import pandas df = pandas.read_csv("volvo_volvo.csv"); dfw
from __future__ import print_function
import statsmodels.api as sm
import statsmodels.formula.api as smf
import pandas as pd
import pandas
df = pandas.read_csv("volvo_volvo.csv");
dfw = pandas.DataFrame(data = df, columns=['x','y'])
y = df.y.values
x = df.x.values
data = pd.DataFrame({'x' : x, 'y' : y}) #to merge the two side by side
print(data)
formula = 'y ~ x'
mod1 = smf.glm(formula=formula, data=data, family=sm.families.Binomial()).fit()
x = mod1.summary()
print(x)
请提供完整的错误回溯,因为不清楚代码的哪一行引发此异常。我猜想这是一行:
y=df.y.values
出于好奇:df
、dfw
和数据帧之间有什么区别?你的y
值是什么?与前面的问题有什么不同?我的数据现在来自csv@MaxU,添加了正在输入的数据,嗯,不知道有什么区别,我只知道它们可以工作,哈哈,对不起
x y
0 50000 16000
1 43000 15000
2 32424 18299
3 92821 14000
4 50392 19000
5 23941 19521
6 29201 20192
7 50192 15291
8 30201 19392
9 20591 18282
10 50401 19294
11 69401 16263
12 22124 16392
13 14940 19583