将二维数组传递给线性回归(SkLearning)
问题描述
我要将二维数组传递给线性回归:
x = [[1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 3, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1],
[0, 0, 0, 0, 0, 0, 0, 0, 1, 0],
[0, 0, 0, 0, 0, 1, 1, 0, 0, 3]]
y = [3.9857, 3.6877, 3.6877]
x = numpy.array(x)
y = numpy.array(y)
model = LinearRegression(z,y).fit(z,y)
我没有使用RESHAPE(-1,1),因为它将2D数组转换为3D
但我收到错误:
ValueError: setting an array element with a sequence
TypeError: float() argument must be a string or a number, not 'list'
如何才能正确地将二维数组传递给线性回归?
解决方案
作为注释键入有点长,因此如果您在转换为Numpy数组之前查看x:
print([len(i) for i in x])
[36, 10, 10]
和y
的长度为3。可以进行线性回归,但每个观察值的自变量需要具有相同数量的变量。
在您的情况下,列表x
的第一个元素应该像其他元素一样具有10个条目。
例如:
import numpy as np
from sklearn import linear_model
clf = linear_model.LinearRegression()
# take the first ten
exo = np.array([i[:10] for i in x])
# fit
clf.fit(exo,np.array(y))
clf.coef_
array([ 8.12727273e-02, -6.93889390e-18, 8.12727273e-02, 0.00000000e+00,
0.00000000e+00, -2.70909091e-02, 5.41818182e-02, 8.12727273e-02,
2.70909091e-02, 0.00000000e+00])
您得到10个系数,x的每列一个系数。
相关文章