jueves, 15 de diciembre de 2011

Estimación.


La estimación es el proceso de utilizar datos muestrales para estimar los valores de parámetros desconocidos de una población. Esencialmente, cualquier característica de la población se puede estimar a partir de una muestra al azar.
La estimación tiene muchas aplicaciones prácticas, por ejemplo: un fabricante de computadoras podría estar interesado en estimar la proporción “P” de computadoras que se descomponen antes de que termine el periodo de garantía de un año.
Otros parámetros poblacionales importantes son la P, σ y μ.
Por ejemplo: podríamos estimar la media del tiempo de espera en una caja registradora a la salida de un supermercado o la variabilidad de un instrumento de medición sobre una pieza en particular, entre otros
                              









CARACTERÍSTICAS DE UN BUEN ESTIMADOR.
*Carencia de sesgo o insesgabilidad.
Un estimador carece de sesgo si la media de la distribución muestral del estadístico (esperanza matemática del estadístico) es igual al parámetro por estimar; es decir, si θ es un estadístico cualquiera y θ es el parámetro correspondiente y si E(θ)= es un estimador insesgado de θ.

*Consistencia.
Por lo general un estimador no es idéntico al parámetro que se estima, existe una diferencia entre ellos |θ -θ| que es el error de muestreo, pero si se aumenta el tamaño de la muestra suficientemente, la probabilidad de que esta diferencia sea mayor que un número fijo ε˃0 tenderá a cero. Esto es p[|θ- θ|˃ ε]→0 cuando n→∞

*Eficiencia.
Se refiere a la precisión que alcanza las estadísticas en la estimación de los parámetros; es decir, será más eficiente cuanto menos varíe de una muestra a otra de una misma población. Un buen estimador será el que menor error típico alcance.



ESTIMACIÓN PUNTAL.
Se refiere a la elección de un estadístico; es decir, un número calculado a través de datos muestrales respecto al cual tenemos una esperanza o seguridad de que este razonablemente cerca del parámetro que ha de estimar.

INTERVALO DE CONFIANZA.
Se le llama a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente estos números determinan un intervalo que se calcula a partir de datos de una muestra y el valor desconocido es un parámetro. La probabilidad de éxito en la estimación se representa 1-α y se denomina nivel de confianza y α= error aleatorio o nivel de significancia.
Para la definición de estimación por intervalos:
                                                 P(a≤ θ ≤b)=1- α
Donde:
a= límite inferior.     b= límite superior.      θ= parámetro
Es posible generar los intervalos para cualquier parámetro desconocido cuando se conoce su distribución de muestreo. Cuando la distribución de muestreo es normal el enunciado de la definición se observa:



El área de probabilidad de “a” hasta θ es lo mismo que de θ hasta “b”; quiere decir, que el intervalo de “a” hasta “b” está centrado en la curva normal. Esto facilita obtener una formula general para determinar los límites del intervalo en aquellas distribuciones muestrales muestrales que se comportan de manera normal.
Formula general para los intervalos de confianza de distribuciones de muestreo normales. Sea:
Z=Ӫ-θ
     σӪ

y los valores de a y  b traducidos a unidades estándar quedaran entonces: las unidades estándar son Z:
a= -Zα/2  b= ­+Zα/2

Entonces la definición anterior de intervalo queda: -Zα/2 ≤ Z ≤ +Zα/2
Sustituyendo:
-Zα/2 Ӫ-θ +Zα/2
                  σӪ 

Despejamos σӪ

-Zα/2  σӪ Ӫ-θ +Zα/2 σӪ *(-1)

Despejamos Ӫ
(-Ӫ- Zα/2 σӪ - θ -Ӫ+ Zα/2  σӪ   )*(-1)  = Ӫ + Zα/2 σӪ θ Ӫ- Zα/2  σӪ


Entonces, queda el enunciado de confianza:
Ӫ - Zα/2 σӪ θ Ӫ + Zα/2  σӪ = 1- α =    x - Zα/2 ( σ/n) μ  x + Zα/2  ( σ/n) = 1- α

Error de estimación
E= ± Zα/2  ( σ/n)

El concepto de error de estimación tiene una importancia vital en cualquier estimación. Esto es a mayor error de estimación habrá menor exactitud en la investigación y viceversa a menor error de estimación habrá mayor exactitud.
Los niveles de confianza más usados (1- α) son: 90%, 95%, 99% que significa las veces de cada cien intervalos que incluyen al verdadero valor del parámetro.

No hay comentarios:

Publicar un comentario