¿Cómo hacer un análisis de regresión bidimensional en Python?
En primer lugar, no estoy familiarizado con Python y todavía apenas entiendo el mecanismo del código Python. Pero necesito hacer un análisis estadístico a través de Python.
He intentado muchas formas de resolverlo pero fallé.
Básicamente, tengo 3 matrices de datos (suponga que estas matrices sonX
, Y
, Z
)Hice un análisis con (X
, Y
) y (Z
, Y
) haciendo el diagrama de dispersión y ajustando mejor los datos para ver la correlación.№1 y №2 son bastante fáciles.Ahora necesito ver el borde a la vista desde el gráfico, que es el que combinaX
yZ
. Entonces, hice la ecuación (ver abajo).import pylab as pl
import numpy as np
from pylab import *
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt
s = np.loadtxt('New_list3.txt')
s = s.T
x = s[1]
y = s[2]
z = s[4]
upper_error = s[5]
lower_error = s[6]
asymmetric_error = [lower_error, upper_error]
def func(X, a1, a2, a3):
x1, y1 = X
return a1 * x1 + a2 * y1 + a3
popt, pcov = curve_fit(func,(x,y),z)
new_x=func((x,y),popt[0],popt[1],0)
new_y=z
new_z = np.polyfit(new_x,new_y,1)
p = np.poly1d(new_z)
plt.plot(func((x, y), popt[0], popt[1], 0), z, '.k')
pl.plot(new_x, p(new_x), "r-")
plt.errorbar(new_x, z ,yerr=asymmetric_error, ecolor='b', capsize=3, marker ='o', fmt='none')
print popt
plt.show()
Ahora no puedo encontrar los errores de esa ecuación que esy = a1 * x + a2 * z + a3
. Encontré los mejores valores dea1
, a2
, a3
. Sin embargo, no los errores.
¿Cómo puedo encontrar los "errores" dea1
, a2
, a3
?