martes, 12 de mayo de 2020

4.6. Simulación de los comporta-mientos aleatorios del proyecto y su verificación

4.5.4. Otras pruebas: Anderson-Darling, prueba G, por ejemplo.

¿Qué es el estadístico de Anderson-Darling?

El estadístico Anderson-Darling mide qué tan bien siguen los datos una distribución específica. Para un conjunto de datos y distribución en particular, mientras mejor se ajuste la distribución a los datos, menor será este estadístico. Por ejemplo, usted puede utlizar el estadístico de Anderson-Darling para determinar si los datos cumplen el supuesto de normalidad para una prueba t.
Las hipótesis para la prueba de Anderson-Darling son:
  • H0: Los datos siguen una distribución especificada
  • H1: Los datos no siguen una distribución especificada
Utilice el valor p correspondiente (si está disponible) para probar si los datos provienen de la distribución elegida. Si el valor p es menor que un nivel de significancia elegido (por lo general 0.05 o 0.10), entonces rechace la hipótesis nula de que los datos provienen de esa distribución. Minitab no siempre muestra un valor p para la prueba de Anderson-Darling, porque este no existe matemáticamente para ciertos casos.
También puede utilizar el estadístico de Anderson-Darling para comparar el ajuste de varias distribuciones con el fin de determinar cuál es la mejor. Sin embargo, para concluir que una distribución es la mejor, el estadístico de Anderson-Darling debe ser sustancialmente menor que los demás. Cuando los estadísticos están cercanos entre sí, se deben usar criterios adicionales, como las gráficas de probabilidad, para elegir entre ellos.

DistribuciónAnderson-DarlingValor p
Exponencial9.599p < 0.003
Normal0.641p < 0.089
Weibull de 3 parámetros0.376p < 0.432

Exponencial

Normal

Weibull de 3 parámetros
Ejemplo de comparación de distribuciones
Estas gráficas de probabilidad son para los mismos datos. Tanto la distribución normal como la distribución de Weibull de 3 parámetros ofrecen un ajuste adecuado a los datos.

Minitab calcula el estadístico de Anderson-Darling usando la distancia al cuadrado ponderada entre la línea ajustada de la gráfica de probabilidad (con base en la distribución elegida y usando el método de estimación de máxima verosimilitud o las estimaciones de mínimos cuadrados) y la función de paso no paramétrica. El cálculo tiene mayor ponderación en las colas de la distribución.

Mostrar el estadístico de Anderson-Darling en una gráfica de probabilidad normal

Para ver una leyenda que muestre el estadístico de la prueba de Anderson-Darling y el valor p cada vez que usted cree una gráfica de probabilidad normal de los residuos:
  1. Choose Herramientas > Opciones > Gráficas individuales > Gráficas de residuos para series de tiempo and Herramientas > Opciones > Modelos lineales > Gráficas de residuo
  2. Marque Incluir prueba de Anderson-Darling con gráfica normal. Haga clic en AceptarMinitab no muestra la prueba cuando hay menos de 3 grados de libertad para el error.

PRUEBA ANDERSON - DARLING

La prueba de Anderson-Darling es usada para probar si una muestra viene de una distribución especifica. Esta prueba es una modificación de la prueba de Kolmogorov- Smirnov donde se le da más peso a las colas de la distribución que la prueba de Kolmogorov-Smirnov.

En estadística, la prueba de Anderson-Darling es una prueba no paramétrica sobre si los datos de una muestra provienen de una distribución específica. La fórmula para el estadístico determina si los datos (observar que los datos se deben ordenar) vienen de una distribución con función acumulativa  F.

Donde:
n es el número de datos
f(x): es la función de distribución de probabilidad teórica
FS(X): es la función de distribución empírica.
Para definir la regla de rechazo para esta prueba es necesario, también, obtener el estadístico ajustado para luego compararlo con los valores críticos de la tabla de Anderson- Darling

Una vez obtenido el estadístico ajustado, la regla de rechazo se realiza análogamente a la utilizada en la prueba de K-S.

El estadístico de la prueba se puede entonces comparar contra las distribuciones del estadístico de prueba (dependiendo que F se utiliza) para determinar el P- valor.

4.5.3. Muestras grandes: prueba de KarlPearson para ajuste de una distribución de probabilidades hipotética, discreta o continua (en hoja de cálculo o con paquete estadístico)

El estudio de Monte Carlo para determinar la validez del empleo de la prueba del error estándar de ajuste como criterio de selección en el análisis de frecuencias. Dicho estadístico se comparó con los estadísticos de prueba de Kolmogorov-Smirnov, Cramer-Von Mises y Anderson-Darling. Las distribuciones elegidas para el propósito de comparar estos estadísticos fueron la gamma, Weibull, Gumbel, log-normal y log-logística. Los resultados obtenidos recomiendan el uso de muestras con tamaño de por lo menos de más den=50 para tener un buen desempeño de las pruebas de Anderson-Darling y error estándar de ajuste. El empleo de las pruebas de Kolmogorov-Smirnov y Cramer-Von Mises o pruebas Karl-Pearson es del todo recomendable




obra hidráulica excede el periodo de las observaciones y deben hacerse extrapolaciones a partir de los valores registrados. Una forma de extrapolar los datos históricos consiste en emplear el método gráfico, que requiere de un analista experimentado y presenta la desventaja de la subjetividad. Una técnica más objetiva es encontrar la distribución de probabilidad teórica que se ajuste mejor a los datos medidos y usar esta función para la extrapolación.
Algunas de las distribuciones de probabilidad usadas en hidrología son normal, log-normal, gamma, Gumbel, Weibull, Pearson tipo III y log-Pearson tipo III (Aksoy, 2000; Aparicio-Mijares, 2005). Un problema importante en el análisis de frecuencias es la selección de una distribución de probabilidad apropiada para los datos observados. Este problema no es exclusivo de la hidrología, también se observa en otras áreas, como la confiabilidad y ciencias actuariales. Quesenberry y Kent (1982) desarrollaron un criterio de selección de distribuciones basado en estadísticos invariantes bajo transformaciones de escala.
Demostraron la efectividad de su criterio a partir de un estudio de Monte Carlo para distinguir entre las distribuciones exponencial, gamma, Weibull y log-normal. Generalmente, la selección de modelos se basa en pruebas de bondad de ajuste, que incluyen métodos gráficos y estadísticos, siendo preferibles los métodos estadísticos por su objetividad (Shin, Jung, Jeong, & Heo, 2011). Entre los métodos estadísticos con mayor aplicación en la hidrología se
encuentran  las  pruebas  de  chi-cuadrado c(2)   del  error  estándar  de  ajuste  (EEA)  (Ganancias- Martínez, 2009).

Otros métodos usados a menudo son los de función de distribución empírica (FDE), que incluyen las pruebas de Kolmogorov-Smirnov (KS), Cramer-Von Mises (CVM) y Anderson- Darling (AD) (p. ej., Laio, 2004; Suhaila & Jemain, 2007; Dan'azumi, Shamsudin, & Aris, 2010; Shin et al., 2011; Atroosh & Moustafa, 2012). Sin embargo, las pruebas estadísticas de bondad de ajuste tienen poco poder para rechazar distribuciones equivocadas (Mitosek, Strupczewski, & Singh, 2002), por lo que en muchos casos, más de una distribución puede ser aceptada por una prueba específica (Laio, Baldasarre, & Montanari, 2009).
las

pruebas de bondad de ajuste. Pueden definirse diversos criterios de selección en función de los estadísticos de bondad de ajuste antes mencionados. Otros criterios de selección se basan en
la función de verosimilitud, como el criterio de información de Akaike (CIA) y el criterio de información Bayesiano (CIB) (Laioet al., 2009). Balasooriya, Low y Wong (2005) evaluaron la efectividad de los criterios de Akaike, y de Quesenberry y Kent. Encontraron que si bien ambos

criterios tuvieron un buen desempeño, el segundo fue ligeramente mejor; sin embargo, la dificultad computacional de este criterio hace preferible el empleo del CIA. Los criterios de selección de modelos probabilísticos han recibido poca atención en la literatura hidrológica.
Mitosek et al. (2002) consideraron las distribuciones Weibull, gamma, Gumbel y log-normal como modelos alternativos para la distribución de caudales pico anuales, y evaluaron estas distribuciones usando tres índices: la desviación absoluta media, la media cuadrática y la función de verosimilitud normalizada. Tras realizar un estudio de Monte Carlo, concluyeron que la función de verosimilitud normalizada representaba el mejor criterio de selección. El Adlouni, Bobée y Ouarda (2008) utilizaron técnicas gráficas para seleccionar la clase de distribuciones que proporciona el mejor ajuste a un conjunto de datos. Utilizaron el criterio de clasificación de Werner y Upper (2002), quienes dividieron las distribuciones en: a) estables; b) con cola tipo Parteo; c) regularmente variantes; d) sub-exponenciales; e) con momentos exponenciales inexistentes.
Estos autores propusieron el empleo de métodos gráficos para determinar la clase de la distribución y después utilizar criterios como el CIA, CIB o AD para seleccionar la distribución de mejor ajuste. Por su parte, Laioet al. (2009) hicieron un análisis del desempeño de tres criterios de selección de modelos: CIA, CIB y AD, aplicados para identificar el mejor modelo
probabilístico de un ajuste de datos hidrológicos extremos.




4.5.2. Muestras pequeñas: prueba de Kolmogórov-Smirnov para ajuste de una distribución de probabilidades continua hipotética (en hoja de cálculo o con paquete estadístico)

En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que determina la bondad de ajuste de dos distribuciones de probabilidad entre sí.
La prueba de Kolmogorov-Smirnov se utiliza para probar la bondad del ajuste de una distribución de frecuencia teórica, es decir, si existe una diferencia significativa entre la distribución de la frecuencia observada y la distribución de frecuencia teórica (esperada).

En un post anterior cubrimos el metodo Chi-Cuadrado. La prueba de K-S es similar a lo que hace la prueba de Chi-Cuadrado, pero la prueba K-S tiene varias ventajas:
  • Pruebas mas potentes.
  • Más fácil de calcular y utilizar, ya que no requiere agrupación de datos.
  • La estadística de prueba es independiente de la distribución de la frecuencia esperada. Sólo depende del tamaño de la muestra n.
LA HIPÓTESIS:
H0: La distribución de frecuencia observada es consistente con la distribución de la frecuencia teórica (Buen ajuste).
H1: La distribución de frecuencia observada no es coherente con la distribución de la frecuencia teórica (Bad ajuste).
α = Nivel de significación de la prueba.

Este procedimiento es un test no paramétrico que permite establecer si dos muestras se ajustan al mismo modelo probabilístico (Varas y  Bois, 1998).
Es un test válido para distribuciones continuas y sirve tanto para muestras grandes como para muestras pequeñas (Pizarro et al, 1986).
Así mismo, Pizarro (1988), hace referencia a que, como parte de la aplicación de este test, es necesario determinar la frecuencia observada acumulada y la frecuencia teórica acumulada; una vez determinadas ambas frecuencias, se obtiene el máximo de las diferencias entre ambas.
El estadístico Kolmogorov-Smirnov,  D, considera la desviación de la función de distribución de probabilidades de la muestra P(x) de la función de probabilidades teórica, escogida Po(x) tal que:
REPORT THIS AD

  Dn = max | P(x) – Po(x) |
La prueba requiere que el valor Dn calculado con la expresión anterior sea menor que el valor tabulado Dα para un nivel de significancia (o nivel de probabilidad) requerido. El valor crítico Dα de la prueba se obtiene de la tabla mostrada, en función del nivel de significancia α y el tamaño de la muestra n.
Tabla de valores de Dα en función del nivel de significancia y del tamaño de la muestra:
Picture1.png
El procedimiento a seguir en la aplicación práctica de la prueba de Kolmogorov-Smirnov es el siguiente:
  • Determinar la frecuencia observada acumulada y la frecuencia téorica acumulada, Po(x) y P(x).
  • En cada caso, calcular: Dn = max | P(x) – Po(x) |
    Así, Dn es la máxima diferencia entre la función de distribución acumulada de la muestra y la función de distribución acumulada teórica escogida
  • Fijar un nivel de probabilidad o de significancia α. Los valores de 0.05 y 0.01 son los más usuales.
  • Determinar el valor crítico Dα en la tabla correspondiente.
  • Aplica el criterio de decisión:
    • Si el valor calculado Dn es menor que el Dα, se acepta la hipótesis nula (Ho) que establece que la serie de datos se ajusta a la distribución teórica escogida.
    • Si el valor calculado Dn es mayor que el Dα, se rechaza la hipótesis nula (Ho) y se acepta la hipótesis alternativa (Ha) que establece que la serie de datos no se ajusta a la distribución teórica escogida.

4.5.1. Estadísticas descriptivas

Elementos de Estadística Descriptiva
Como ya fue explicado la estadística descriptiva permite organizar y presentar un conjunto de datos de manera que describan en forma precisa las variables analizadas haciendo rápida su lectura e interpretación.
Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la distribución de frecuencias y b) la representación gráfica. Estos sistemas de organización y descripción de los datos permiten realizar un análisis de datos univariado, bivariado o trivariado, dependiendo de los objetivos y de la naturaleza de la investigación que se realiza.
Distribución de Frecuencias. Comunmente llamada tabla de frecuencias, se utiliza para hacer la presentación de datos provenientes de las observaciones realizadas en el estudio, estableciendo un orden mediante la división en clases y registro de la cantidad de observaciones correspondientes a cada clase. Lo anterior facilita la realización de un mejor análisis e interpretación de las características que describen y que no son evidentes en el conjunto de datos brutos o sin procesar. Una distribución de frecuencias constituye una tabla en el ámbito de investigación.
La distribución de frecuencias puede ser simple o agrupada. La distribución de frecuencias simple es una tabla que se construye con base en los siguientes datos: clase o variable (valores numéricos) en orden descendente o ascendente, tabulaciones o marcas de recuento y frecuencia. Por ejemplo, si se construye una distribución de frecuencias sobre los resultados finales que arrojó la evaluación de un curso de planeación estratégica para estudiantes de administración correspondientes al semestre agosto-diciembre de 1998, se tienen los siguientes datos brutos: 86, 80, 84, 84, 74, 88, 87, 84, 74, 77, 77, 82, 68, 78, 67, 74, 66, 86, 65, 88,69 se procede a organizarlos en forma ascendente o descendente y se tiene en orden descendente:
88, 88, 87, 86, 86, 84, 84, 84, 82, 80, 78, 77, 77, 74, 74, 74, 69, 698, 67, 66, 65 posteriormente se registran en una tabla de distribución de frecuencias simple (ver Tabla 4.1). Cuando se pretende “... determinar el número de observaciones que son mayores o menores que determinada cantidad,” (Webster, 1998, p. 27) se utiliza la distribución de frecuencias agrupadas también conocida como distribución de frecuencias acumuladas. La distribución de frecuencias agrupadas es una tabla que contiene las columnas siguientes: intervalo de clase, puntos medios, tabulación frecuencias y frecuencias agrupadas. Los pasos para diseñarla son:
1 Se localizan el computo mas alto y el mas bajo de la serie de datos.
2 Se encuentra la diferencia entre esos dos computos.
3 La diferencia obtenida se divide entre números nones tratando de encontrar un cociente cercano a 15 pero no mayor. Lo anterior indica cuantas clases va a tener la distribución de frecuencias agrupadas y cuál va a ser la magnitud del intervalo de clase.
4 Se determina el primer intervalo de clase y posteriormente se van disminuyendo los límites del intervalo de clase de acuerdo al valor de la magnitud establecida previamente.
El ejemplo planteado en la distribución de frecuencias simples se utilizará tanto para efectos de ejemplificación de la distribución de frecuencias agrupadas como para el diseño de gráficas tipo polígono de frecuencias, histograma y ojiva. En la Figura 4.2 se presenta un ejemplo de una distribución de frecuencias agrupada.
Los computos mayor y menor son las puntuaciones 88 y 65, la diferencia es 88-65=23 y el número de intervalos de clase es 23/3= 7.68.
b) Representación Gráfica. A partir de la distribución de frecuencias se procede a presentar los datos por medio de gráficas. La información puede describirse por medio de gráficos a fin de facilitar la lectura e interpretación de las variables medidas. Los actuales sistemas computacionales como Excel, Lotus Smart Suite, Minitab, SAS-PC, Stath Graph, entre otros permiten obtener representaciones gráficas de diversos conjuntos de datos. Las gráficas pueden ser tipo histograma, polígono de frecuencias, gráfica de series de tiempo, etc,

4.5. Muestras definitivas

Reglas de Carácter General en Materia de Comercio Exterior y sus resoluciones de modificación.
NORMAS Y/O POLÍTICAS:
PRIMERA. Las muestras y muestrarios podrán ser importados en forma definitiva de conformidad con el procedimiento establecido en el presente Apartado.
SEGUNDA. Para efecto de la norma anterior y de conformidad con el inciso d) de la Regla 9ª. de las complementarias para la aplicación de la TIGIE, contenida en la fracción II del artículo 2 de la LIGIE, las muestras son los artículos que por su cantidad, peso, volumen u otras condiciones de presentación indiquen sin lugar a dudas que sólo pueden servir para demostración de mercancía o levantamiento de pedidos. Se considera que se encuentran en este supuesto los productos, artículos efectos y otros bienes, que cumplan con los siguientes requisitos:
1. Su valor unitario no exceda del equivalente en moneda nacional a un dólar .
2. Que se encuentren marcados, rotos, perforados o tratados de modo que los descalifique para su venta o para cualquier uso distinto al de muestras. La marca relativa deberá consistir en el uso de pintura o tinta que sea claramente visible, legible y permanente.
3. No se encuentren contenidas en empaques para comercialización, excepto que dicho empaque se encuentre marcado, roto o perforado conforme al numeral anterior.
4. No se trate de mercancías de difícil identificación que por su presentación en forma de polvos, líquidos o formas farmacéuticas, tales como: pastillas, trociscos, comprimidos, granulados, tabletas, cápsulas, grageas; requieran de análisis físicos y/o químicos para conocer su composición, naturaleza, origen y demás características necesarias para determinar su clasificación arancelaria.
Tratándose de muestras o muestrarios de juguetes, el valor unitario de los mismos podrá ser hasta de 50 dólares o su equivalente en moneda nacional y podrán importarse un máximo de dos piezas del mismo modelo, siempre que se cumpla con lo dispuesto en los numerales 2 y 3 de la presente norma.
En estos casos, se entenderá por muestrario, la colección de muestras que por su cantidad, peso, volumen u otras condiciones de presentación indique, sin lugar a dudas, que sólo pueden servir de muestras.
TERCERA. En estos casos, se deberá elaborar el pedimento de importación definitiva con A1, asentando el identificador MM, conforme a lo establecido en los Apéndices 2 y 8 del Anexo 22 de las RCGMCE, las muestras y muestrarios deberán declararse bajo la fracción arancelaria 9801.00.01 de la TIGIE, las cuales, en ningún caso, podrán ser objeto de comercialización.
Las muestras y muestrarios por sus condiciones carecen de valor comercial, por lo tanto no existe valor en aduana.
CUARTA. Asimismo, las personas morales podrán importar en definitiva muestras amparadas bajo un protocolo de investigación en humanos, aprobado por la Comisión Federal para la Protección contra Riesgos Sanitarios, para lo cual deberán, por conducto de AA o Ap. Ad., elaborar un pedimento A1 y declarar en el campo correspondiente, la fracción arancelaria 9801.00.01 de la TIGIE.
QUINTA. Para efecto del párrafo anterior, se deberá indicar en el pedimento la clave del identificador “MI”, conforme a lo establecido en Apéndice 8 del Anexo 22 de las RCGMCE, asimismo, en el campo de observaciones deberá asentarse los siguientes datos:
a) Denominación común internacional, denominación genérica o nombre científico de la muestra a importar.
b) Número de Autorización de Protocolo emitido por la autoridad competente.
La mercancía que se importe conforme a lo establecido en la norma anterior no podrá ser objeto de comercialización ni utilizada para fines promocionarles.
  1. SEXTA. El pedimento de importación definitiva deberá presentarse junto con las muestras y muestrarios ante el mecanismo de selección automatizado, en los casos en que el resultado determine reconocimiento aduanero o segundo reconocimiento, éstos se practicarán en los términos establecidos en Quinta y Sexta Unidad del presente Manual, según corresponda.
La simulación de muestreo es un método para derivar estimaciones robustas de errores estándar e intervalos de confianza para estimaciones como la media, mediana, proporción, razón de las ventajas, coeficientes de correlación o coeficientes de regresión. También se puede utilizar para crear contrastes de hipótesis. La simulación de muestreo es más útil como alternativa a estimaciones paramétricas en caso de que los supuestos de esos métodos sean dudosos (como en el caso de modelos de regresión con residuos heteroscedástico se ajusten a muestras pequeñas), o si la inferencia paramétrica no es posible o requiere fórmulas muy complicadas para el cálculo de errores estándar (como en el caso de cálculo de intervalos de confianza de mediana, cuartiles y otros percentiles).

Ejemplos

Una empresa de telecomunicaciones pierde alrededor del 27% de sus clientes por abandono cada mes. Para reducir el porcentaje de abandono, los directivos quieren saber si este porcentaje varía en diferentes grupos de clientes predefinidos. Mediante la simulación de muestreo, puede determinar si un porcentaje concreto de abandonos describe de forma adecuada los cuatro tipos principales de clientes.
En una revisión de los registros de empleados, los directivos están interesados en las experiencias anteriores de los empleados. La experiencia laboral es asimétrica, lo que hace que la media sea una estimación menos deseable de la experiencia laboral "habitual" entre los empleados que la mediana. Sin embargo, los intervalos de confianza no están disponibles para la mediana en el producto.
Los directivos también están interesados en determinar los factores que están asociados con los aumentos de salarios de los empleados mediante la definición de un modelo lineal de la diferencia entre el salario inicial y el actual. Al realizar una simulación de muestreo de un modelo lineal, puede utilizar métodos de muestreado sucesivo especiales (simulación de muestreo residual y wild) para obtener resultados más precisos.
Muchos procedimientos admiten simulación de muestreo y la combinación de resultados a partir del análisis de muestras de simulación de muestreo. Los controles para especificar análisis de simulación de muestreo se integran directamente como un diálogo subordinado común en procedimientos que admiten simulación de muestreo. La configuración del cuadro de diálogo de simulación de muestreo permanece en los procedimientos de forma que, si ejecuta un análisis de frecuencias con simulación de muestreo en los cuadros de diálogo, la simulación de muestreo se activará de forma predeterminada para otros procedimientos que lo admitan.

Cómo obtener un análisis de programa de arranque

  1. En los menús seleccione un procedimiento que admita la simulación de muestreo y pulse en Simular muestreo.
  2. Seleccione Ejecutar simulación de muestreo.
También puede controlar las siguientes opciones:
Número de muestras. Para los intervalos de percentil y BCa producidos, se recomienda utilizar al menos 1000 muestras de simulación de muestreo. Especifique un número entero positivo.
Definir semilla para tornado de Mersenne. Si se establece una semilla es posible replicar análisis. El uso de este control es parecido a establecer el tornado de Mersenne como generador activo y especificar un punto de inicio fijo en el cuadro de diálogo Generadores de números aleatorios, con la importante diferencia de que la definición de la semilla de este cuadro de diálogo mantendrá el estado actual del generador de números aleatorios y restaurará dicho estado cuando haya terminado el análisis. Consulte el tema Generadores de números aleatorios para obtener más información.
Intervalos de confianza. Especifique un nivel de confianza mayor que 50 y menor que 100. Los intervalos de percentiles sólo utilizan los valores de simulación de muestreo ordenados correspondientes a los percentiles de intervalo de confianza deseados. Por ejemplo, un intervalo de confianza de percentil del 95% utiliza los percentiles 2,5 y 97,5 de los valores de simulación de muestreo como los límites inferior y superior del intervalo (interpolando los valores de simulación de muestreo si es necesario). Los intervalos de sesgo corregidos y acelerados (BCa) son intervalos ajustados que son más precisos, pero necesitan más tiempo de cálculo.
Muestreo. El método Simple consiste en volver a muestrear los casos reemplazándolos del conjunto de datos original. El método Estratificado consiste en volver a muestrear los casos sustituyendo el conjunto de datos original, en los estratos definidos por las variables de estratos de clasificación cruzada. El muestreo de simulación de muestreo estratificado puede ser muy útil si las unidades de los estratos son relativamente homogéneas aunque las unidades para todos los estratos son muy diferentes.

4.4.3. Intervalos de confianza

Intervalos de confianza

La estimación puntual aproxima mediante un número el valor de una característica población o parámetro desconocido (la altura media de los españoles, la intención de voto a un partido en las próximas elecciones generales, el tiempo medio de ejecución de un algoritmo, el número de taxis…) pero no nos indica el error que se comete en dicha estimación.
Lo razonable, en la práctica, es adjuntar, junto a la estimación puntual del parámetro, un intervalo que mida el margen de error de la estimación. La construcción de dicho intervalo es el objetivo de la estimación por intervalos de confianza.
Un intervalo de confianza para un parámetro con un nivel de confianza 1α (0<α<1), es un intervalo de extremos aleatorios (L,U) que, con probabilidad 1α, contiene al parámetro en cuestión.P(parámetro(L,U))=1α.
Los valores más habituales del nivel de confianza 1α son 0.9,0.95 o 0.99 (la confianza es del 90%,95% o 99%). En ocasiones también se emplea la terminología nivel de significación para el valor α.
En la estimación por intervalos de confianza partimos de una muestra x1,,xn. A partir de estos valores obtenemos un intervalo numérico. Por ejemplo, podríamos hablar de que, con una confianza del 99 por ciento, la proporción de voto al partido político “Unidas Ciudadanas” está entre el 29 y el 31 por ciento. O que, con una confianza del 90 por ciento, la estatura media está entre 1.80 y 1.84.

Estimación por intervalo de confianza

Los estimadores puntuales sólo dan una idea aproximada del valor del parámetro a estimar, no conociéndose cómo de buena es la aproximación; ellos simplemente proporcionan el mejor número que pueda proponerse como valor del parámetro. Por ejemplo decir que µ1=170 cm significa que la estatura media de todos los españoles es aproximadamente 170 cm, pero el término "aproximado" no se sabe si alude a 1 cm arriba o abajo, o a 1 metro arriba o abajo. De hecho no puede esperarse gran cosa de un estimador.
Los problemas anteriores eran de esperar pues realmente es demasiado pedir que a partir de una muestra pueda calcularse el valor del parámetro tan exactamente como si se tomara toda la población. En realidad lo que importa es que el valor de la media muestral ,por ejemplo, no esté demasiado alejado de µ, y esto se comprueba con los intervalos de confianza.
El objetivo es realizar afirmaciones del tipo: "la estatura media ( de los españoles no sé exactamente cuanto es, pero es casi seguro alguno de los valores , con una cierta seguridad. La seguridad alude a la probabilidad de que la afirmación sea cierta, con lo que el problema de obtener intervalos de confianza para un parámetro radica en encontrar dos valores a y b tales que ,donde (a , b) es el intervalo de confianza para , 1 - el nivel de confianza del intervalo (usualmente próximo a 1) y  el nivel de error del intervalo (usualmente próximo a 0).
Intervalo de Confianza para una media
Variables Normales.
Supongamos una v. a. x con distribución N(µ ;) en donde la media µ es desconocida y la varianza , la suponemos por ahora conocida. Con el fin de estimar µ (colesterol medio, nivel medio de glucosa, altura media de los varones mayores de edad, etc.) se va a tomar una muestra aleatoria x1 ,x,...,xn que proporciona una media que será una estimación puntual de µ. Aceptaremos sin demostrarlo que:
       (4.1)
con probabilidad del 95%, y así tenemos el intervalo buscado. Esta expresión debe interpretarse adecuadamente. Ella indica que el 95% de las muestras de tamaño n tendrán una media que, al sustituirla en la expresión, da lugar a un intervalo que contiene en su interior a µ, en tanto que otro 5% no sucederá esto. Nótese que se ha dicho que "el intervalo contiene en su interior a µ, y no que "µ cae en el interior del intervalo"; la primera afirmación es cierta pues los extremos del intervalo son v. a. por depender de  que también lo es; la segunda afirmación es falsa pues µ es un parámetro (valor fijo aunque desconocido), no una v.a., no pudiendo variar. Así pues debe decirse que hay una probabilidad del 95% de que el intervalo contenga al parámetro.
En el ejemplo de la estatura media µ de los españoles, si se tiene que , dado que el 95% de los intervalos contienen a µ, diremos que "tenemos la esperanza de que este sea uno de los 95 intervalos de cada 100 que dejan en su interior a µ, esperando no haber tenido la mala suerte de que el intervalo obtenido sea uno de los 5 de cada 100 intervalos erróneos". Más abreviadamente, diremos que µ está entre (169 ; 172) "con una confianza del 95%"; de ahí el nombre de intervalo de confianza. Conviene notar que ahora se habla de "confianza" , y no de "probabilidad" como antes, pues los extremos del intervalo ya son números fijos y µ o está o no está dentro.
El intervalo (4.1) podemos expresarlo abreviadamente como , debiéndose el valor 1,96 al 5% de error tomado, es decir z0,05 = 1,96 en la tabla de la Distribución Normal.. De un modo general, si en lugar de una confianza del 95% tomamos una de (1 - ), (o en lugar de un error del 5% se toma uno de ), entonces el intervalo será:
 (4.2)
con ,en la tabla de la D. N..
    Ejemplo 1: Para determinar la estatura media de los varones adultos españoles, se tomó una muestra al azar de 10 de ellos en la que se obtuvo los valores 162, 176, 169, 165, 171, 169, 172, 168, 167 y 175 cm. Determinar el valor de la estatura media, suponiendo que = 16.
    Un estimador puntual para la estatura media µ es la que en este caso es 169,4. Para dar un intervalo de confianza hemos de suponer que es una v. a. normal. Como n=10, = 169,4 y  = 4, para el intervalo de confianza al 95%, la expresión (4.1) indica que 
    Así pues, esperamos que este intervalo sea un de los 95 de cada 100 que contienen a µ, o, más brevemente, la estatura media de los españoles varones adultos es algún valor entre 166,92 cm y 171,88 cm con una confianza del 95%.
Es evidente que un intervalo de confianza para un  dado será tanto más preciso cuanto más estrecho sea. Así, será preferible afirmar que la estatura media está entre 170 y 171 cm al 95% de confianza, que afirmar que la estatura está entre 165 y 175 con igual confianza. Como la longitud del intervalo es dos veces su radio, el mismo puede disminuirse aumentando el valor del tamaño de la muestra (pues n aparece dividiendo). Ello responde a una regla que será general en toda la Estadística: cuanto más grande sea una muestra, más información da y más precisas son las conclusiones que se obtengan a partir de ella.
La otra forma de estrechar el intervalo es disminuyendo la confianza ( es decir, aumentando el error). Así z0,05 = 1,96, pero z0,15 = 1,44, que por ser menor da un intervalo más estrecho. Sin embargo ahora la anchura del intervalo ha disminuido a costa de la seguridad (confianza) del mismo, y ello no es deseable. Lo usual es considerar errores  del 5%, aunque en ocasiones se utilizan otros como los del 1% o del 10%. Nos podemos preguntar ¿se puede dar un intervalo al 100% de confianza?; la respuesta es que esto exigiría una z0,00 = , con lo que el intervalo sería ( -) que en el caso del ejemplo daría lugar a la afirmación "la estatura media de los españoles está entre - y  ", que es absolutamente cierta y absolutamente inútil también.
Hasta este momento hemos supuesto que la varianza de la población era conocida, lo que no suele ser real. Cuando  es desconocida, lo lógico es sustituirla por su estimador s, obteniendo así que .Sin embargo s es una v. a. y unas veces será más grande que  y otras más pequeña, lo que da una cierta imprecisión al intervalo. Conviene ensanchar un poco el intervalo para que la confianza del mismo permanezca. El modo de hacerlo consiste en aumentar el valor de , localizándolo en una tabla distinta. Ahora tendremos:
(4.3)
con t en la tabla de la distribución t de Student con (n-1) grados de libertad, tabla que presenta los valores de t en un formato similar al de la distribución normal, excepto en que la nueva variable depende de un nuevo parámetro llamado grados de libertad.
    Ejemplo 2: Resolver el ejemplo anterior sin suponer conocido el valor de .
    De antes se conoce que n =10 y = 169,4. Ahora es preciso calcular la varianza muestral por la fórmula correspondiente lo que da s = 4,3. Como t0,05 (9 g.l.)= 2,262 en la tabla , entonces es el intervalo de confianza para µ al 95% de confianza.
La interpretación del nuevo intervalo es idéntica del que resultaba cuando la varianza era conocida, la única diferencia es que ahora no sólo el centro del intervalo es variable, sino que también lo es su radio.
Tamaño de la muestra.
En la fase de diseño de una experiencia suele plantearse cuál debe ser el tamaño mínimo de la muestra para lograr una precisión dada en la estimación de la media. Así, ¿cuántos españoles debo tomar para determinar su estatura media con una precisión de 1 cm? Con ello se quiere indicar que si concluyo que debo tomar n = 100 españoles y tomo una muestra de 100 de ellos, la estatura media en la muestra () distará de la media de la población (µ) en menos de 1 cm (en general d cm), es decir que  con una cierta confianza. Otro modo de decir lo mismo es afirmar que si es =170 en la muestra de 100 que se ha decidido como idónea, entonces sé que ( va a estar entre 169 y 171 ( es decir entre -d y +d). . Como además se tiene  habrá de ser , y despejando n queda:
(4.4)
La expresión (4.4) tiene la desventaja de depender de , valor desconocido usualmente.
Tenemos varias alternativas para resolver este inconveniente:
1º )Sustituir por el valor máximo que se piense pueda tomar, según nuestras experiencias previas. En el peor de los casos n será mayor de lo necesario. Quedaría:
(4.5)
2º) Tomar una muestra piloto de tamaño n´ pequeño, obtener en ella su varianza  y entonces:
(4.6)
con t en la Tabla de la t de Student con n´-1 g.l.
3º) Enunciar la precisión en términos de fracciones de . Así, si deseamos ocurra que con una confianza 1-, cambiando d2 por K2 en la (4.4) queda:
(4.7)
    Ejemplo 3: Determinar el tamaño de muestra requerido para obtener la estatura media de la población, con una precisión de 1 cm, si la varianza poblacional es = 25.
    Tomando n=97 individuos, según la fórmula (4.4) la media de ellos estará en el intervalo x1al 95% de confianza. El redondeo se hace siempre por exceso pasa asegurar la precisión.
    Ejemplo 4: Determinar el tamaño de la muestra para obtener la estatura media de una población con una precisión de 0,3.
    Ahora n=43, según la expresión (4.7),y, entonces la media está en 0,3
    Ejemplo 5: Con datos del Ejemplo 1 como muestra piloto, determinar n con precisión d=4cm
    Ahora n´=10 y . Como 6 < 10 = n´, ello indica que con la muestra piloto nos basta para la precisión deseada.
    Ejemplo 6: Igual que el anterior pero exigiendo un d = 1 cm.
    De nuevo n´= 10 y ahora , con lo que son precisos 85 individuos más que antes.
Intervalo de confianza para una proporción.
Vamos a empezar este apartado planteando un ejemplo.
    Ejemplo 7: Si de 100 personas encuestadas, 30 se manifiestan a favor de un determinado partido político, ¿qué porcentaje de votos obtendría dicho partido de celebrarse en ese momento las elecciones? (confianza del 95%)
    Obsérvese que x="nº de individuos, entre los 100 encuestados, que votarán al candidato" es una Binomial de parámetro n = 100 y p desconocido. El objetivo es determinar p teniendo en cuenta que x sigue una B(n,p), con n = 100 y x = 30 el valor obtenido experimentalmente de esa Binomial. Conviene expresar que todo lo que sigue contiene las fórmulas para p expresadas en tantos por uno, no en %.