INFERENCIA ESTADÍSTICA
La inferencia estadística es el conjunto de métodos que permiten deducir o inferir el comportamiento de una población a partir de la información que proporciona una muestra y el grado de fiabilidad de los resultados obtenidos.
Técnicas de muestreo
Las técnicas de muestreo son las distintas formas en las que se puede elegir una muestra. Lo primero que tenemos que tener en cuenta es que, para que la muestra sea representativa, el muestreo tiene que ser aleatorio, es decir, que los individuos se elijan al azar. De esta forma se evita que la persona que realiza la encuesta refleje lo que ella cree que es la realidad.
Existen varios tipos de muestreo dependiendo de si la muestra es homogénea (no está dividida en grupos o estratos) o heterogénea (está dividida en grupos o estratos)
1.- Muestreo aleatorio simple
Se utiliza para poblaciones homogéneas y es el método más sencillo, ya en él se basan todos los demás. Consiste en numerar de forma aleatoria todos los elementos de una población del 1 al N y se seleccionan al azar los n elementos que forman la muestra, pudiéndose utilizar dos procedimientos:
- el uso de un bombo o caja donde se introducen N papeletas o bolas numeradas del 1 al N y se van sacando, sin reemplazamiento, la n bolas o papeletas que formarán la muestra
- el uso de números aleatorios. Si el tamaño de la muestra es pequeño, se puede utilizar directamente una calculadora: la tecla RAN genera números aleatorios comprendidos entre 0 y 0´999. Multiplicando estos números por N obtenemos un número aleatorio comprendido entre 1 y N -1. Por lo tanto, tomando la parte entera del número obtenido al hacer la secuencia N · RAN + 1, se obtiene un número aleatorio comprendido entre 1 y N.
Si el tamaño de la muestra es grande, se pueden utilizar tablas de números aleatorios, que están formadas por grupos de dígitos obtenidos al azar mediante un ordenador, ordenados por filas y columnas.
2.- Muestreo aleatorio sistemático
Se utiliza para poblaciones homogéneas. Consiste en numerar de forma aleatoria todos los elementos de la población del 1 al N y, a partir de uno de ellos, llamado origen, se obtienen los siguientes mediante "saltos" numéricos iguales, llamado coeficiente de elevación:
- el coeficiente de elevación, h, y se obtiene mediante la fórmula: h = N / n.
- el origen se obtiene mediante un muestreo aleatorio simple
3.- Muestreo aleatorio estratificado
Se utiliza para poblaciones heterogéneas. Supongamos que la población está dividida en L grupos o estratos y queremos que en la muestra haya individuos de cada uno de los estratos:
- Si el tamaño de los estratos de la población es igual, se utiliza un muestreo aleatorio estratificado constante, en el que el número de elementos de cada uno de los estratos de la muestra sería:
Para elegir los individuos en cada grupo o estrato de la muestra se utiliza un muestreo aleatorio simple o sistemático.
- Si el tamaño de los estratos de la población es distinto, se utiliza un muestreo aleatorio estratificado proporcional, en el que el número de elementos de cada uno de los estratos de la muestra se obtiene de aplicar las siguientes proporciones:
Nuevamente, para elegir los individuos en cada grupo o estrato de la muestra se utiliza un muestreo aleatorio simple o sistemático.
Distribución de media muestral
Supongamos una población en la que se ha definido una variable cuantitativa de interés, X, por ejemplo, el gasto mensual en alimentación.
Supongamos ahora que extraemos de dicha población distintas muestras de tamaño n, y de cada una de ellas, con los datos obtenidos de la variable (X
Distribución de la proporción muestral
Supongamos una población de la que conocemos la
proporción de individuos con una determinada característica, p (por ejemplo, la
proporción de jóvenes que son seguidores del Real Madrid)
Supongamos
ahora que extraemos de dicha población distintas muestras de tamaño n, y
de cada una de ellas, con los datos obtenidos de preguntar si son seguidores o
no del Real Madrid, calculamos la proporción de seguidores (p) :
Estimación por intervalos de confianza
Aunque en los ejercicios de distribución de media y proporción muestral conocíamos los parámetros de la población, lo normal es que sea al revés, es decir, que los parámetros de la población sean desconocidos y se obtengan a partir de la muestra: ésto es lo que se conoce como estimación de parámetros poblacionales.
Para estimar parámetros poblacionales se pueden utilizar dos procedimientos:
1.- Estimaciones puntuales: que consiste en asignar directamente el parámetro muestral al de la población
2.- Estimaciones por intervalos: que consiste en buscar un intervalo centrado en el parámetro muestral en el que tengamos bastante certeza de que se encuentre el parámetro poblacional buscado, llamado intervalo de confianza (IC). El parámetro que mide la certeza o seguridad de que el parámetro poblacional se encuentre en el intervalo se llama nivel de confianza (nc) y la cantidad que sumamos y restamos al parámetro muestral para obtener el intervalo centrado en él se llama error en la estimación (E)
La estimación por intervalos siempre es mucho más fiable que la puntual ya que al dar como solución todos los valores de un intervalo tenemos más seguridad de acertar que si damos como solución un único valor.
Para obtener el intervalo de confianza de un parámetro poblacional aplicamos lo indicado con anterioridad:
Utilizaremos las desviaciones típicas de la media muestral o proporción muestral según sea el parámetro pedido.
La eficacia de la estimación es tanto mayor cuanto más pequeño sea el intervalo de confianza y mayor sea el nivel de confianza.
Comentarios
Publicar un comentario