UNIVERSIDAD DE SAN CARLOS

FACULTAD DE INGENIERIA

ANALISIS DE REGRESION CUADRATICA

Ing. Agr. Luis Manfredo Reyes Chávez

Profesor Titular Departamento de Estadística

1. INTRODUCCION:

El modelo de regresión cuadrática es una alternativa cuando el modelo lineal no logra un coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento que puede considerarse como parabólico. La forma más simple de tratar de establecer la tendencia es a través de un diagrama de dispersión o nube de puntos, tal como la siguiente:

Este modelo también es conocido como parabólico, y es el caso más simple de modelos de regresión polinomiales, siendo su grado igual a 2.

2. Ecuación característica

La función que define el modelo es la siguiente:

Y_i=A+Bx_i+Cx_i²+E

En la cual:

Y_i : Variable dependiente, iésima observación

A, B, C: Parámetros de la ecuación, que generalmente son desconocidos

E: Error asociado al modelo

X_{i :} Valor de la í-esima observación de la variable independiente

Al sustituir los parámetros por estimadores, el modelo adopta la siguiente forma:

y_i=a+bx_i+cx_i²

3. Tabla de datos

Para el ajuste de un conjunto de datos al modelo cuadrático de regresión, se construye la siguiente tabla de datos:

X	y	X²	X³	X⁴	*X y**	*X²y**	y²

..	..	..	..	..	..	..	..


Σx	Σy	Σx²	Σx³	Σx⁴	*Σ xy**	Σx²y	Σy²

4. Estimadores del modelo

los estimadores para el ajuste del modelo se calculan de la siguiente manera:

5. Análisis de varianza para la regresión

Con el objeto de determinar si el modelo explica o no el fenómeno en estudio, se realiza el análisis de varianza, que se calcula de la siguiente manera

Fuente de Variación	Grados de libertad	Suma de cuadrados	Cuadrado medio	F calculada	F tabulada
Regresión	2	b* (Σxy-ΣxΣy/n)+c( Σx²y- *Σx² Σy/n)**	S.C. Reg/2	C.M.Reg/C.M.Error
Error	n-3	S.C. Total- S.C. Regresión	S.C. Error/(n-3)
Total	n-1	Σ(y)²-(Σy)² /n

Ho: El modelo no explica el fenómeno en estudio

Ha: El modelo sí explica el fenómeno en estudio

Para buscar en la tabla la F tabulada, se usan el el numerador los grados de libertad de regresión y en el denominador, de acuerdo al nivel de significancia escogido (los más usuales son al 5% y al 1%)
Si el valor de F calculada es mayor que el de F tabulada, se rechaza Ho, en caso contrario se acepta

6. Grado de ajuste del modelo

Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinación, de la siguiente manera:

7. Càlculo de estimadores, coeficiente de determinaciòn y anàlisis de varianza mediante el uso de matrices

Un mètodo alternativo para realizar los càlculos, es el uso de matrices. En este caso, el procedimiento es el siguiente:

i) formar la matriz x: (matriz de variable independiente), agregando la primera columna formada por unos y una tercera columna formada por los valores de x elevados al cuadrado:

1	x₁	X₁²
1	x₂	X₂²
...	.....	.....
1	x_n	X_n²

ii) Formar el vector de valores de y

y₁

y₂

.....

y_n

iii) Formar la matriz x transpuesta ( x´)

1	1	...	1
x₁	x₂	...	xn
X₁²	X₂²	...	X_n²

iv) Calcular el producto matricial x´x

v) Calcular la inversa del producto x´x (o sea [x´x]^-1

vi) Calcular el producto x´y

vii) Calcular el producto (x´x)^-1*(x´y)=D

El resultado de esta operaciòn es el vector de coeficientes de regresiòn en el orden a,b,c

viii) Para el càlculo del anàlisis de varianza, se tienen las siguientes operaciones

matriciales:

Fuente de Variación	Grados de libertad	Suma de cuadrados	Cuadrado medio	F calculada	F tabulada
Regresión	2	D´( x´ )(y)-ny_m²	S.C. Reg/2	C.M.Reg/C.M.Error	*
Error	n-3	y´y-D´( x´ )(y)	S.C. Error/(n-3)
Total	n-1	y´y- ny_m²

El valor de y_mque se usaen los cálculos es el promedio de valores de y (Σy/n)

ix) Finalmente, el coeficiente de determinaciòn por matrices se obtiene de la

siguiente manera:

r²= [D´(x´)(y)- ny_m²]/[(y´y)- ny_m²]

8. Pruebas de Hipótesis para el modelo

Para el planteo y prueba de hipótesis, es necesario definir el término “multiplicadores de Gauss”

Los multiplicadores de Gauss son los elementos de la matriz inversa x´x:

7.1 Para el coeficiente b

Para probar la hipótesis de que el coeficiente b es igual a un valor b´, se procede de la siguiente manera:

i) Se plantea la hipótesis Ho: b= b´ y la alternativa Ha: b≠ b´

ii) Se calcula el estadístico :

S_bes conocido como el error standard de b y se calcula de la siguiente manera:

El cuadrado medio del error se obtiene del anàlisis de varianza.

iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:

n-3 grados de libertad y un nivel α/2

iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso

contrario, se acepta .

7.2 Para el coeficiente c

Para probar la hipótesis de que el coeficiente c es igual a un valor c´, se procede de la siguiente manera:

i) Se plantea la hipótesis Ho: c= c´ y la alternativa Ha: c≠ c´

ii) Se calcula el estadístico :

S_bes conocido como el error standard de b y se calcula de la siguiente manera:

El cuadrado medio del error se obtiene del anàlisis de varianza.

iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:

n-3 grados de libertad y un nivel α/2

iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso

contrario, se acepta .

7.3 Para el coeficiente a

Se puede probar la hipótesis de que el coeficiente a es igual a un valor a´, para lo

cual se sigue el siguiente procedimiento:

i) Se define la hipótesis: Ho: a=a´ y la alternativa Ha: a≠a´

ii) Se calcula el error standard para a con la siguiente fórmula:

iii) Se calcula el estadístico de prueba:

iv) Se obtiene en la tabla de t de student el estadístico comparador, con los siguientes datos: n-3 grados de libertad y nivel α/2

v) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la hipótesis se acepta

8. Intervalos de confianza

8.1 Para el coeficiente b

El intervalo de confianza para el coeficiente b se calcula así:

El cuadrado medio del error se obtiene del análisis de varianza