martes, 12 de mayo de 2020

4.5.3. Muestras grandes: prueba de KarlPearson para ajuste de una distribución de probabilidades hipotética, discreta o continua (en hoja de cálculo o con paquete estadístico)

El estudio de Monte Carlo para determinar la validez del empleo de la prueba del error estándar de ajuste como criterio de selección en el análisis de frecuencias. Dicho estadístico se comparó con los estadísticos de prueba de Kolmogorov-Smirnov, Cramer-Von Mises y Anderson-Darling. Las distribuciones elegidas para el propósito de comparar estos estadísticos fueron la gamma, Weibull, Gumbel, log-normal y log-logística. Los resultados obtenidos recomiendan el uso de muestras con tamaño de por lo menos de más den=50 para tener un buen desempeño de las pruebas de Anderson-Darling y error estándar de ajuste. El empleo de las pruebas de Kolmogorov-Smirnov y Cramer-Von Mises o pruebas Karl-Pearson es del todo recomendable




obra hidráulica excede el periodo de las observaciones y deben hacerse extrapolaciones a partir de los valores registrados. Una forma de extrapolar los datos históricos consiste en emplear el método gráfico, que requiere de un analista experimentado y presenta la desventaja de la subjetividad. Una técnica más objetiva es encontrar la distribución de probabilidad teórica que se ajuste mejor a los datos medidos y usar esta función para la extrapolación.
Algunas de las distribuciones de probabilidad usadas en hidrología son normal, log-normal, gamma, Gumbel, Weibull, Pearson tipo III y log-Pearson tipo III (Aksoy, 2000; Aparicio-Mijares, 2005). Un problema importante en el análisis de frecuencias es la selección de una distribución de probabilidad apropiada para los datos observados. Este problema no es exclusivo de la hidrología, también se observa en otras áreas, como la confiabilidad y ciencias actuariales. Quesenberry y Kent (1982) desarrollaron un criterio de selección de distribuciones basado en estadísticos invariantes bajo transformaciones de escala.
Demostraron la efectividad de su criterio a partir de un estudio de Monte Carlo para distinguir entre las distribuciones exponencial, gamma, Weibull y log-normal. Generalmente, la selección de modelos se basa en pruebas de bondad de ajuste, que incluyen métodos gráficos y estadísticos, siendo preferibles los métodos estadísticos por su objetividad (Shin, Jung, Jeong, & Heo, 2011). Entre los métodos estadísticos con mayor aplicación en la hidrología se
encuentran  las  pruebas  de  chi-cuadrado c(2)   del  error  estándar  de  ajuste  (EEA)  (Ganancias- Martínez, 2009).

Otros métodos usados a menudo son los de función de distribución empírica (FDE), que incluyen las pruebas de Kolmogorov-Smirnov (KS), Cramer-Von Mises (CVM) y Anderson- Darling (AD) (p. ej., Laio, 2004; Suhaila & Jemain, 2007; Dan'azumi, Shamsudin, & Aris, 2010; Shin et al., 2011; Atroosh & Moustafa, 2012). Sin embargo, las pruebas estadísticas de bondad de ajuste tienen poco poder para rechazar distribuciones equivocadas (Mitosek, Strupczewski, & Singh, 2002), por lo que en muchos casos, más de una distribución puede ser aceptada por una prueba específica (Laio, Baldasarre, & Montanari, 2009).
las

pruebas de bondad de ajuste. Pueden definirse diversos criterios de selección en función de los estadísticos de bondad de ajuste antes mencionados. Otros criterios de selección se basan en
la función de verosimilitud, como el criterio de información de Akaike (CIA) y el criterio de información Bayesiano (CIB) (Laioet al., 2009). Balasooriya, Low y Wong (2005) evaluaron la efectividad de los criterios de Akaike, y de Quesenberry y Kent. Encontraron que si bien ambos

criterios tuvieron un buen desempeño, el segundo fue ligeramente mejor; sin embargo, la dificultad computacional de este criterio hace preferible el empleo del CIA. Los criterios de selección de modelos probabilísticos han recibido poca atención en la literatura hidrológica.
Mitosek et al. (2002) consideraron las distribuciones Weibull, gamma, Gumbel y log-normal como modelos alternativos para la distribución de caudales pico anuales, y evaluaron estas distribuciones usando tres índices: la desviación absoluta media, la media cuadrática y la función de verosimilitud normalizada. Tras realizar un estudio de Monte Carlo, concluyeron que la función de verosimilitud normalizada representaba el mejor criterio de selección. El Adlouni, Bobée y Ouarda (2008) utilizaron técnicas gráficas para seleccionar la clase de distribuciones que proporciona el mejor ajuste a un conjunto de datos. Utilizaron el criterio de clasificación de Werner y Upper (2002), quienes dividieron las distribuciones en: a) estables; b) con cola tipo Parteo; c) regularmente variantes; d) sub-exponenciales; e) con momentos exponenciales inexistentes.
Estos autores propusieron el empleo de métodos gráficos para determinar la clase de la distribución y después utilizar criterios como el CIA, CIB o AD para seleccionar la distribución de mejor ajuste. Por su parte, Laioet al. (2009) hicieron un análisis del desempeño de tres criterios de selección de modelos: CIA, CIB y AD, aplicados para identificar el mejor modelo
probabilístico de un ajuste de datos hidrológicos extremos.




No hay comentarios:

Publicar un comentario