将二维数组传递给线性回归(SkLearning)

问题描述

我要将二维数组传递给线性回归:

x = [[1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 3, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1],
     [0, 0, 0, 0, 0, 0, 0, 0, 1, 0], 
     [0, 0, 0, 0, 0, 1, 1, 0, 0, 3]]
y = [3.9857,  3.6877, 3.6877]

x = numpy.array(x)
y = numpy.array(y)

model = LinearRegression(z,y).fit(z,y)

我没有使用RESHAPE(-1,1),因为它将2D数组转换为3D

但我收到错误:

ValueError: setting an array element with a sequence
TypeError: float() argument must be a string or a number, not 'list'

如何才能正确地将二维数组传递给线性回归?


解决方案

作为注释键入有点长,因此如果您在转换为Numpy数组之前查看x:

print([len(i) for i in x])
[36, 10, 10]

y的长度为3。可以进行线性回归,但每个观察值的自变量需要具有相同数量的变量。

在您的情况下,列表x的第一个元素应该像其他元素一样具有10个条目。

例如:

import numpy as np
from sklearn import linear_model
clf = linear_model.LinearRegression()

# take the first ten
exo = np.array([i[:10] for i in x])

# fit
clf.fit(exo,np.array(y))
clf.coef_

array([ 8.12727273e-02, -6.93889390e-18,  8.12727273e-02,  0.00000000e+00,
        0.00000000e+00, -2.70909091e-02,  5.41818182e-02,  8.12727273e-02,
        2.70909091e-02,  0.00000000e+00])

您得到10个系数,x的每列一个系数。

相关文章