lunes, 26 de noviembre de 2007

REGRESIÓN LINEAL Y CORRELACIÓN

ANALISIS DE CORRELACIÓN:
Es un estudio que se hace a la relación que existe entre las variables de tal manera que se emplea para medir la intensidad de la asociación entre dos variables. Para lo cual se necesita mostrar los datos en un DIAGRAMA DE DISPERSIÓN, el cual es una gráfica en la que se representa la relación entre dos o más variables.

Dentro de éste análisis, identificamos princialmente dos tipos de variables:
VARIABLE DEPENDIENTE: que es aquella que se predice o ccalcula
VARIABLE INDEPENDIENTE: que es quella que proporciona las bases para el cálculo.


COEFICIENTE DE CORRELACIÓN
Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo.
como se vío en el video presentado la clase anterior; el utilizar los gemelos como mueestra nos sirve como un conjunto dentro del cual contiene las mismas características físicas pero diferentes características intelectuales.

ANÁLISIS DE REGRESIÓN
Se necesita de una ecuación para expresar la relación lineal entre 2 variables. Además hallar el valor de la Variable Dependiente Y en base en un valor de la variable Independiente X; ésta ecuación se llama Ecuación de Regresión.

Con ésta ecuación podemos determinar la pendiente de la línea de Regresión, el Punto donde se intercepta con el eje Y y la forma general:

forma general: Y' = a + bx
Y' = que es Y prima el cual es el valor pronosticado de la variable para un valor seleccionado de X.

a= es la ordenada de la intersección conY donde la recta de regresión que cruza el eje Y cuando X = 0.

b= es la pendiente de la recta o el cambio promedioen Y, donde X es la unidad de cambio en la Variable Independiente X.

x= es cualquier valor seleccionado de la Variable Independiente.

Dentro de éste sistema puede existir un error estándar de estimación, de acuerdo a la medida de la dispersioón, de los valores observados con respecto a la línea de regresión y es calculado mediante una fórmula.

11

Ahora analizaremos en una amplia manera lo referente a las pruebas de hipótesis, las cuales a través de una prueba para varianzas se someterán ha comprobación y verificación para determinar si las medias provienen de poblaciones similares o iguales.

La distribución F -
F no puede ser negativa, y es una distribución continua.
F se utiliza para probar la hipótesis de que la varianza de una población normal es igual a la varianza de otra población normal.
Para pruebas de varianzas iguales de dos colas el estadístico de prueba estará dado por una formula respectiva..

Esta distribución es utilizada para comparar simultáneamente si varias medias poblacionales provienen de probaciones con varianzas iguales además comprobar si dos muestras tienes características de varianza iguales.


ANOVA
La distribución F se la utiliza para poder probar si dos o más medias muestrales provienen de la misma o igual población.
Para calcular ANOVA debemos tener en cuenta las siguientes caracteristicas:.
- Las poblaciones están distribuidas normalmente por estándar iguales.
- Las muestras se seleccionan independientemente.
- Las poblaciones tienen desviaciones

De esta manera con el sistema ANOVA podemos comparar las medias de forma simultánea y evitar de ete modo podemos evitar que ocurra un error de tipo I

Tabla de ANOVA= donde podemos encontrar el valor F reemplazando en la misma los valores para encontrar el valor final.
Necesitamos de cinco pasos para probar una hipótesis en este sistema ANOVA ; los grados de libertad del numerador y del denominador son los mismos que se utiliza para encontrar el valor crítico de F.
Los siguientes pasos nos ayudaran a encontrar el valor:
- Primero encontraremos la Suma de Cuadrados Total (SS total)
- La Suma de Cuadrados Debidos al Tratamiento (SST)
- Finalmente la Suma de los Cuadrados del Error (SSE)
y asi de acuerdo con los valores que nos dan en la tabla rechazamos o aprobamos la hipótesis.