Paola Nugra

martes, 29 de enero de 2008

NÚMEROS INDICES

El número índice es una medida estadística diseñada para poner los cambios en una variable o en un grupo de variables relacionadas con respecto al tiempo, situación geográfica, ingreso o cualquier otra característica, es decir Los índices son de mucha utilidad, para describir ciertas cantidades ya sea de cualquier aspecto, por lo tanto un número índice es aquel que nos indica, o expresa la variación relativa existente entre dos indicadores como por ejemplo el PIB o el IPC , expresando las cantidades o valores de acuerdo con un año o período base. Podemos distinguir números índice simples los cuales son útiles especialmente para medir la variación en el caso de que haya una sola variable.
Este tipo de número puede definirse también como un valor relativo con base igual a 100% o un múltiplo de 100% tal como 10 y 100, que permite medir qué tanto una variable ha cambiado con el tiempo.
Los números índice se clasifican en:
1. Simples
2. Compuestos, estos a su vez se clasifican en:
Sin ponderar
Ponderados
Índices Simples : Son los que se refieren a una sola magnitud o concepto, y, por tanto, nos proporcionan la variación que ha sufrido esa magnitud en dos períodos distintos.
Índices Compuestos

Existen 2 tipos de índices de precios:

1. Ponderados.-
Aunque los índices compuestos ponderados se pueden obtener para todo tipo de variables, los más importantes son los que miden las variaciones en los precios
En este caso se toma en cuenta las cantidades, y se puede calcular mediante el método de Laspeyres y el de Paasche donde Laspeyres utiliza las ponderaciones del periodo base, y el de Paasche utiliza las ponderaciones del año actual, los cuales difieren solo en el periodo utilizado para la ponderación. Existe un índice que combina lo mejor de los dos antes vistos, a este se lo conoce como índice ideal de Fisher, el cual se lo calcula obteniendo la raíz cuadrada del producto de los índices de Laspeyres y Paasche.

2. No Ponderados.-
Son los que tratan de medir la evolución de una magnitud compleja, pero donde las diferentes magnitudes simples que intervienen tienen todas la misma importancia.

Cada uno de los métodos mencionados tienen algunas ventajas y desventajas, sin embargo a mi punto de vista el de Paasche o y de Fisher son los más apropiados para usarlos ya que estos consideran los precios actuales y no los base, que son precos anteriosres y posiblemente desactualizados, así pues los números índice, son de gran utilidad ya que facilitan la comprensión en caso de que existan números con cantidades muy grandes.

martes, 15 de enero de 2008

JI CUADRADA

MÉTODOS NO PARAMÉTRICOS

Las pruebas no paramétricas o libres de Distribución usan datos de nivel:
ü Nomina
ü Ordinal

Existen algunas ventajas sobre las pruebas no paramétricas:
ü Son accesibles a ser usadas con muestras pequeñas
ü No se necesita suposiciones restrictivas de las pruebas paramétricas.
ü Se usan con datos cualitativos siendo fácil de comprender.

Desventajas de las pruebas no paramétricas:
ü Muchas de las veces no son muy eficientes como las pruebas paramétricas.
ü Es posible que pierdan la información o la ignoren muchas de las veces.
ü Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa ( con un error de tipo II).

ANALISIS DE TABLAS DE CONTINGENCIAS
Las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa-nominales u ordinales-.

Prueba de Bondad de Ajuste: “Frecuencias Esperadas Iguales”
Se utiliza para cualquier nivel de datos, comparando un conjunto de frecuencias observadas, con un conjunto de frecuencias esperadas.
Se aplica la distribución Ji cuadrada.

Para éste estadístico lo resolveremos de acuerdo a cinco pasos:

1. Establecemos la hipótesis nula y alternativa:
Ho= No existe diferencia entre el conjunto de frecuencias observadas y el conjunto de frecuencias esperadas.
H1= Si existe diferencia entre los dos conjuntos de frecuencias

2. Seleccionar el nivel de significancia, de 0.05 ya que es igual a la probabilidad de cometer un error de tipo 1.

3. Se escoge el estadístico de prueba, en este caso la distribución JI CUADRADA ( x2 ).
x2 = ∑[ ( f0 - fe )2 ]
fe

Con k-1 grados de libertad.
K= numero de categorías
f0 = frecuencia observada en una categoría determinada
fe= frecuencia esperada en una categoría determinada.

4. Se formula la regla de decisión, determinando el valor crítico, utilizando el apéndice I de la tabla de la distribución de ji cuadrada, considerando k – 1 grados de libertad.

5. Se calcula el valor de ji cuadrada, considerando las columnas y filas respectivas y se toma una decisión final.

Ji CUADRADA:

Es una prueba alternativa para demostrar, que los números que produce un generador de aleatorios tienen (o no) una distribución uniforme.
Cuando no se puede considerar la pertenencia de una muestra a una población de distribución conocida es el momento de aplicar técnicas no paramétricas, las cuales son útiles cuando las suposiciones no se cumplen.

CARACTERÍSTICAS

El valor de ji cuadrada nunca es negativo ya que el valor entre las dos frecuencias es eleva al cuadrado
Existe una familia de distribuciones de Ji cuadrada para cada grado de libertad, el valor no dependerá del tamaño de la muestra sino del número de categorías.
Tiene sesgo positivo; conforme aumenta el número de grados de libertad, la distribución comienza a aproximarse a la de tipo normal.

LIMITACIONES DE JI CAUDRADA

Si solo hay dos celdas la frecuencia esperada en cada celda debe ser igual o mayor a 5.
Para mas de dos celdas no debe aplicarse ji cuadrada si mas de 20% de las celdas de fe tienen frecuencias esperadas menores que 5.

lunes, 26 de noviembre de 2007

REGRESIÓN LINEAL Y CORRELACIÓN

ANALISIS DE CORRELACIÓN:
Es un estudio que se hace a la relación que existe entre las variables de tal manera que se emplea para medir la intensidad de la asociación entre dos variables. Para lo cual se necesita mostrar los datos en un DIAGRAMA DE DISPERSIÓN, el cual es una gráfica en la que se representa la relación entre dos o más variables.

Dentro de éste análisis, identificamos princialmente dos tipos de variables:
VARIABLE DEPENDIENTE: que es aquella que se predice o ccalcula
VARIABLE INDEPENDIENTE: que es quella que proporciona las bases para el cálculo.

COEFICIENTE DE CORRELACIÓN
Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo.
como se vío en el video presentado la clase anterior; el utilizar los gemelos como mueestra nos sirve como un conjunto dentro del cual contiene las mismas características físicas pero diferentes características intelectuales.

ANÁLISIS DE REGRESIÓN
Se necesita de una ecuación para expresar la relación lineal entre 2 variables. Además hallar el valor de la Variable Dependiente Y en base en un valor de la variable Independiente X; ésta ecuación se llama Ecuación de Regresión.

Con ésta ecuación podemos determinar la pendiente de la línea de Regresión, el Punto donde se intercepta con el eje Y y la forma general:

forma general: Y' = a + bx
Y' = que es Y prima el cual es el valor pronosticado de la variable para un valor seleccionado de X.

a= es la ordenada de la intersección conY donde la recta de regresión que cruza el eje Y cuando X = 0.

b= es la pendiente de la recta o el cambio promedioen Y, donde X es la unidad de cambio en la Variable Independiente X.

x= es cualquier valor seleccionado de la Variable Independiente.

Dentro de éste sistema puede existir un error estándar de estimación, de acuerdo a la medida de la dispersioón, de los valores observados con respecto a la línea de regresión y es calculado mediante una fórmula.

11

Ahora analizaremos en una amplia manera lo referente a las pruebas de hipótesis, las cuales a través de una prueba para varianzas se someterán ha comprobación y verificación para determinar si las medias provienen de poblaciones similares o iguales.

La distribución F -
F no puede ser negativa, y es una distribución continua.
F se utiliza para probar la hipótesis de que la varianza de una población normal es igual a la varianza de otra población normal.
Para pruebas de varianzas iguales de dos colas el estadístico de prueba estará dado por una formula respectiva..

Esta distribución es utilizada para comparar simultáneamente si varias medias poblacionales provienen de probaciones con varianzas iguales además comprobar si dos muestras tienes características de varianza iguales.

ANOVA
La distribución F se la utiliza para poder probar si dos o más medias muestrales provienen de la misma o igual población.
Para calcular ANOVA debemos tener en cuenta las siguientes caracteristicas:.
- Las poblaciones están distribuidas normalmente por estándar iguales.
- Las muestras se seleccionan independientemente.
- Las poblaciones tienen desviaciones

De esta manera con el sistema ANOVA podemos comparar las medias de forma simultánea y evitar de ete modo podemos evitar que ocurra un error de tipo I

Tabla de ANOVA= donde podemos encontrar el valor F reemplazando en la misma los valores para encontrar el valor final.
Necesitamos de cinco pasos para probar una hipótesis en este sistema ANOVA ; los grados de libertad del numerador y del denominador son los mismos que se utiliza para encontrar el valor crítico de F.
Los siguientes pasos nos ayudaran a encontrar el valor:
- Primero encontraremos la Suma de Cuadrados Total (SS total)
- La Suma de Cuadrados Debidos al Tratamiento (SST)
- Finalmente la Suma de los Cuadrados del Error (SSE)
y asi de acuerdo con los valores que nos dan en la tabla rechazamos o aprobamos la hipótesis.

lunes, 29 de octubre de 2007

capt.10

PRUEBA DE HIPOTESIS PARA UNA MUESTRA

HIPÓTESIS: Es un supuesto, un enunciado acerca de una población, la cual tendrá que ser comprobada como falsa o verdadera, para lo cual necesitamos de una prueba de Hipótesis, que no es más que un proceso que sirve para determinar si la hipótesis planteada es razonable, y para ello es necesario basarse en la Evidencia Muestral y la Teoría de Probabilidad, para éste procedemiento seguimos cinco pasos:

Plantear la hipótesis NULA Y ALTERNATIVA.
Seleccionar el Nivel de Significancia
Identificar el estadistico de prueba
Formular la regla de decision
Se toma una muestra y se decide

Se obtiene los resultados donde podemos tener: H0 = No se acepta
H0 = Se rechaza
H1 = Se Acepta

HIPÓTESIS NULA, es una afirmación que sirve para edificar la media de la población y de la muestra, cuando los valores no han cambiado; por otro lado tenemos la HIPÓTESIS ALTERNATIVA, que es una afirmación que se acepta si los datos muestrales nos dan la evidencia de que la hipótesis Nula sea Falsa.

Otro dato muy importante es el NIVEL DE SIGNIFICANCIA, el cual es el riesgo o probabilidad de rechazar la hipótesis nula cuando ésta es verdadera dentro de ésto se pueden sucitar dos tipos de errores; un error tipo I, que es la probabilidad de que rechacemos la hipótesis nula cuando esta en realidad sea verdadera; y error de tipo II que es aceptar la hipótesis Nula cuando ésta sea falsa.

Esta varicaion de valores, se debe tomar en cuenta ya que los datos son los de una muestra y no el 100% de una población por lo que existirá la rpobabilidad de fallo, además el investigador debe decidir que nivel de significancia usar, y para hacerlo es necesario tener el Valor Determinado de la Información Muestral, que es un estadistico de Prueba, todo ésto antes de formular la regla de decisión, la cual establece las condiciones específicas en las que se rechaza o no una hipótesis Nula, y en la gráfica se representa dicha regón de rechazo, que se encuentra dividida por el Valor Critico.

PRUEBAS DE SIGNIFICANCIA DE UNA Y DOS COLAS

Es de una cola cuando la Región de Rechazo está solo en la cola derecha superior de la curva, y es de dos colas cuando la Región de Rechazo está en la cola izquierda inferior de la Distribución Normal; de éste modo la región de rechazo será positiva y negativa respectivamente.

martes, 23 de octubre de 2007

Capitulo 9

ESTIMACIÒN PUNTUAL.- Es un estadìstico usado para estimar un paràmetro poblacional , usando la informaciòn obtenida de la muestra.

Una estimaciòn puntual no nos proporciona mucha informaciòn como para saber que tan cerca se esta del paràmetro poblacional; y es donde utilizamos el INTERVALO DE CONFIANZA, el cual es un conjunto de valores obtenido a partir de los datos muestrales.

Existe otro tèrmino muy importante el NIVEL DE CONFIANZA, que se refiere a la probabilidad que existe de que los valores de la muestra se encuentren dentro del intervalo, y se lo mide en porcentaje.

En èste tema se trata la Desviaciòn Estàndar a aquella de la distribuciòn muestral, en la mayor parte de los casos, no se tiene la desviaciòn estàndar poblacional, entonces la calculamos a partir de una fòrmula dividiendo la desviación estándar para la raiz del numero poblacional.

Aqui el error estándar está afectado por dos valores:

Desviación estándar, si es grande o pequeño el error tambien lo es.
Tamaño de la muestra, si aumenta el error disminuye, ya que tomamos más proporción del total de la poblacion que cuando reducimos el total de la población a una pequeña muestra, la probabilidad de error será mayor.

Existen diferentes formas de calcular un intervalo de confianza, por ejemplo:: para la media poblacional se calcula tomando "t" como variable y dividiendo la desviacion estandar para la raiz del numero de la población; donde consideramos que la muestra proviene de una población Normal, y estimamos la desviación estándar muestral, para todo esto si la muestra es por lo menos de 30.

INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN: Entendemos por proporción al la parte de la muestra o de la población que tiene la característica particular de que se trate; se determina mediante el número de éxitos dividido para el número de observaciones.

Aqui el error muetsral a la proporción se refiere a la variabilidad en la distribución de las proporciones muestrales.Para estimar la media se lo hace expresando el nivel de confianza en "z", un máximo de error permitido; "s" es la variación en la población y finalmente con una fórmula para determinar el tamaño de la muestra para la media.

domingo, 7 de octubre de 2007

Estadistica

Muestreo

el muestreo es tomar algunas porciones de la población para formar mi muestra que es con lo que voy a trabajar. Esto lo hacemos cuando trabajamos con poblaciones muy extensas que tomaria mucho tiempo hacerlo y ademas generaria mayor gasto. por ejemplo las estadisticas de las votaciones para presidentes suelen hacerse por muestreo, depende de cada empresa que método ocupe para ademas considerar cual seria el margen de error en las encuestas.ademas físicamente no se podria estudiar a todos los integrantes de la población, por lo cual nunca su efectividad nos dará 100% de certeza o seguridad.
Existen algunos métodos de muestreo de probabilidad:

MUESTRA PROBABILISTICA: todos los integrantes de la población tienen una probabilidad ( posibilidad) de formar parte de la muestra.

MUESTRA ALEATORIA SIMPLE: (es el más utilizado) todos los integrantes de la poblacion tienen la misma probabilidad de formar parte de la muestra. EJEMPLO: esto se lo realizrá al azar, en la clase de Estadística II existen 48 alumnos si queremos saber la estatura promedio de ellos, tomamos de la lista y que cada uno diga un numero al azar y se ira escogiendo nuestra muestra.

MUESTRA ALEATORIA SISTEMÁTICA: los integrantes de la población son ordenados en forma sistemática es de cir en forma ordenada, sleccionando luego al azar el punto de partida desde donde vamos a empzar a escoger la muestra y asi dependiendo de que sistema usemos ya sea alfabéticamente o cada 10 elementos etc. EJEMPLO: con el mismo ejemplo usado anteriormente , si la muestra la tomamos de acuerdo a un pat´rón de cada tres estudiantes , por supueto luego de haber seleccionado al azar nuestro punto de partida.
MUESTREO ALEATORIO ESTRATIFICADO: Aqui la poblacion se divide en subgrupos , y de cada grupo se escoge la muestra , aqui se puede involucrar tambien el muestreo sistemático ya que para un mejor seleccion de la muestra. EJEMPLO: Si en la clase de estadistica de 48 alumnosn dividimos el grupo por sexo hombres y mujeres y de cada grupo tomamos nuestro punto de partida por supuesto esto estara previamente ordenado alfabéticamente para de ahio tomar nuestro punto de partida al azar y luego si escoger la muestra, de tal manera que obtenemos una muestra mas pequeña y mas facil de manejar.

ERROR DE MUESTREO: dentro de todas estos tipos de muestra antes mencionados como no estamos tomando todos los elmentos de la población, puede existir un mergen de error que sera con un porcentaje ´de hasta 5% de error en las encuestas. Este error se deduce de la diferencia entre el estadístico de la muestra y de la población.

DISTRIBUCIÓN DE MUESTREO DE MEDIAS MUESTRALES: consta de todas las medias muestrales posibles de un tamaño de muestra previamente dado, es decir que de cada muestra, se toma media indivual de estas combianaciones , para luego si obtener de todas estas una nueva media.

TEOREMA DEL´LÍMITE CENTRAL: resulta de cuando tomamos todas las muestras de un tamaño determinado, la distriibución de medias nos dará una de tipo normal es decir serán iguales en valor, lo que aumenta en el caso de muestras más grandes.

La media de una población es igual a la media +/- el margen de error posible; pero existe menor variación en la distribución muestral de medias, que en la población.