Pruebas de Normalidad en Geoestadística. Un nuevo enfoque basado en la distancia de Mahalanobis
Resumen
En geoestadística, bajo estacionariedad, kriging simple (KS) es el mejor predictor lineal (MPL) y kriging ordinario (KO) es el mejor predictor lineal insesgado (MPLI). Cuando el proceso estocástico es Normal, KS no es solo un MPL sino un mejor predictor (MP), es decir que bajo la función de pe ́rdida cuadrática, éste coincide con la esperanza condicional del predictor dada la información. En este escenario, el predictor KO sirve como aproximación del MP. Por esta razón, en geoestadística aplicada, es importante probar el supuesto de normalidad. Dada una realización de un proceso espacial, KS será un predictor óptimo si el vector aleatorio subyacente sigue una distribución normal multivariada. Algunas pruebas de normalidad clásicas como Shapiro-Wilk (SW), Shapiro-Francia (SF), o Anderson-Darling (AD) son usadas para evaluar este supuesto. Estas asumen independencia y por ello no son apropiadas en geoestadística (y en general en estadística espacial). Por un lado, las observaciones en geoestadística son espacialmente correlacionadas. Por otro lado la optimalidad del kriging es fundamentada en normalidad multivariada (no en normalidad univariada). En este trabajo se presenta un estudio de simulación para mostrar por qué es inapropiado el uso de pruebas univaridas de normalidad con datos geoestadísticos. También, como solución al problema anterior, se propone una adaptación de la prueba de Mahalanobis al contexto geoestadístico para hacer de manera correcta el test de normalidad en este ambito.
Palabras clave
Distribución chi-cuadrado, distribución normal multivariada, distancia de Mahalanobis, prueba de normalidad, campo aleatorio, simulación de Monte Carlo
Referencias
- G. Robertson. “Geostatistics in ecology: interpolating with known variance ”. Ecology, vol. 68, no. 3, pp 744-748, 1987. DOI: https://doi.org/10.2307/1938482
- T. Hooks, D. Marx, S. Kachman, J. Pedersen, R. Eigenberg, R. “Analysis of covariance with spatially correlated secondary variables ”. Revista Colombiana de Estadística, vol. 31, no. 1, pp. 95-109, 2008.
- G. Severino, M. Scarfato, G. Toraldo. “Mining geostatistics to quantify the spatial variability of certain soil flow properties ”. Procedia Computer Science, vol. 98, 419-424, 2016. DOI: https://doi.org/10.1016/j.procs.2016.09.064
- I. Gundogdu. “Usage of multivariate geostatistics in interpolation processes for meteorological precipitation maps ”. Theoretical and Applied Climatology, vol. 127, no. 1-2, 81-86, 2017. DOI: https://doi.org/10.1007/s00704-015-1619-3
- R. Giraldo, L. Herrera, V. Leiva. “Cokriging prediction using as secondary variable a functional random field with application in environmental pollution ”. Mathematics, vol. 8, no.8, 1305, 2020. DOI: https://doi.org/10.3390/math8081305
- M. Oliver, R. Webster. Basic steps in geostatistics: The variogram and kriging. Springer. 2015. DOI: https://doi.org/10.1007/978-3-319-15865-5
- E. Lehmann, G. Casella. Theory of Point Estimation. Springer-Verlag, 1998.
- J. Chiles, P. Delfiner. Geostatistics: Modeling Spatial Uncertainty. John Wiley & Sons, 1999. DOI: https://doi.org/10.1002/9780470316993
- O. Schabenberger, C. Gotway. Statistical Methods for Spatial Data Analysis. Chapman & Hall, 2005.
- D. McGratha, C. Zhangb, O. Cartona. “Geostatistical analysis and hazard assessment on soil lead in silvermines area, Ireland ”. Environmental Pollution, vol. 127, 239-248, 2004. DOI: https://doi.org/10.1016/j.envpol.2003.07.002
- V. Júnior, M. Carvalho, J. Dafonte, O. Freddi, E. Vidal, O. Ingaramoc. “Spatial variability of soil water content and mechanical resistance of Brazilian ferralsol ”. Soil & Tillage Research, vol. 85, 166-177, 2006. DOI: https://doi.org/10.1016/j.still.2005.01.018
- A. Dexter, A. Czyz, O. Gate. “A method for prediction of soil penetration resistance ”. Soil & Tillage Research, vol. 93, 412-419, 2007. DOI: https://doi.org/10.1016/j.still.2006.05.011
- K. Kamarudin, M. Tomita M, K. Kondo, S. Abe. “Geostatistical estimation of surface soil carbon stock in Mt. Wakakusa grassland of Japan ”. Landscape and Ecological Engineering, vol. 15, no.2, 215-221, 2019. DOI: https://doi.org/10.1007/s11355-019-00370-1
- J. Iqbal, J. Thomasson, J. Jenkins, P. Owens, Whisler, F. “Spatial variability analysis of soil physical properties of alluvial soils ”. Soil Science Society of America Journal, vol. 69, 1338-1350, 2005. DOI: https://doi.org/10.2136/sssaj2004.0154
- L. Pozdnyakova, D. Giménez, P. Oudemans. “Spatial analysis of cranberry yield at three scales ”.Agronomy Journal, vol. 97, 49-57, 2005. DOI: https://doi.org/10.2134/agronj2005.0049
- M. Carrara, A. Castrignano, A. Comparetti, P. Febo, S. Orlando. “Mapping of Penetrometer Resistance in Relation to Tractor Traffic Using Multivariate Geostatistics ”. Geoderma, vol. 142, 294-307, 2007. DOI: https://doi.org/10.1016/j.geoderma.2007.08.020
- J. Lima, S. Silva. “Multivariate analysis and geostatistics of the fertility of a humic rhodic hapludox under coffee cultivation ”. Revista Brasileira de Ciencia do Solo, vol. 36, no. 2, 467-474, 2012. DOI: https://doi.org/10.1590/S0100-06832012000200016
- E. Barca, D. De Benedetto, A. Stellaccic. “Contribution of EMI and GPR proximal sensing data in soil water content assessment by using linear mixed effects models and geostatistical approaches ”. Geoderma, vol. 343, no. 1, 280-293, 2019. DOI: https://doi.org/10.1016/j.geoderma.2019.01.030
- E. Pardo-Igúzquiza, P. Dowd. “Normality tests for spatially correlated data ”. Mathematical Geology, vol. 36, no. 6, 659-681, 2004. DOI: https://doi.org/10.1023/B:MATG.0000039540.43774.2b
- R. Olea, V. Pavlosky. “Kolmogorov-Smirnov test for spatially correlated data ”. Stochastic Environmental Research and Risk Assessment, vol. 23, no.6, 749-757, 2008. DOI: https://doi.org/10.1007/s00477-008-0255-1
- K. Mardia. “Measures of multivariate skewness and kurtosis with applications ”. Biometrika. vol. 57, no. 3, 519-530, 1970. DOI: https://doi.org/10.1093/biomet/57.3.519
- G.Szekely, M. Rizzo. “A new test for multivariate normality ”. Journal of Multivariate Analysis. vol. 93, 58-80, 2005. DOI: https://doi.org/10.1016/j.jmva.2003.12.002
- T. Anderson. An Introduction to Multivariate Statistical Analysis. John Wiley & Sons, 1984.
- N. Cressie. Statistic for Spatial Data. John Wiley & Sons, 1993. DOI: https://doi.org/10.1002/9781119115151
- P. Diggle, P. Ribeiro. Model-Based Geostatistics. 14th Simposio Nacional de Probabilidade e Estatística, Associacao Brasileira de Estatística, 2000.
- P. Diggle, P. Ribeiro. Model-Based Geostatistics. Springer, 2007. DOI: https://doi.org/10.1007/978-0-387-48536-2
- E. Lehmann, G. Casella. Theory of Point Estimation. Springer-Verlag, 1998.
- I. Cardoso De Oliveira, D. Ferreira. “Multivariate extension of Chi-squared univariate normality test ”. Journal of Statistical Computation and Simulation. vol. 80, no. 5, 513-526, 2010. DOI: https://doi.org/10.1080/00949650902731377
- R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/. 2019.
- P. Ribeiro, P. Diggle. “geoR: A package for geostatistical analysis ”. Journal of Statistical Computation and Simulation. vol. 1, no. 2, 14-18, 2007.
- E. Pebesma, R. Bivand. “S classes and methods for spatial data: The sp package ”. R news, vol. 5, no. 2, 9-13, 2005.
- J. Gross, U. Ligges. nortest: Tests for Normality. R package version 1.0-4, URL https: //CRAN.Rproject. org/package=nortest. 2015.
- Dudewicz E, Mishra S. Modern Mathematical Statistics. John Wiley & Sons, 1988.
- H. R. Vega, E. Manzanares, V.M. Hernández, G. A. Mercado, E. Gallego y A. Lorente,
- “Características dosimétricas de fuentes isotópicas de neutrones”, Revista Mexicana de Física, vol. 51, no. 5, pp. 494-501, 2005.
- H. R. Vega y C. Torres, “Low energy neutrons from a 239PuBe isotopic neutron source inserted in moderating media”, Revista Mexicana de Física, vol. 48, no. 5, pp. 405-412, 2002.
- N. C. Tam, J. Bagi y L. Lakosi, “Determining Pu isotopic composition and Pu content of PuBe sources by neutron coincidence technique”, Nuclear Instruments and Methods in Physics Research, vol. 262, pp. 75-80, 2007. DOI: https://doi.org/10.1016/j.nimb.2007.05.005
- I. ElAgib, J. Csikai, J. Jordanova y L. OlaAh, “Leakage neutron spectra from spherical samples with a Pu-Be source”, Applied Radiation and Isotopes, vol. 51, pp. 329-333, 1999. DOI: https://doi.org/10.1016/S0969-8043(99)00046-9
- J. Bagi, N. C. Tam y L. Lakosi, “Assessment of the Pu content of Pu-Be neutron sources”, Nuclear Instruments and Methods in Physics Research, vol. 222, pp. 242-248, 2004. DOI: https://doi.org/10.1016/j.nimb.2003.12.085
- R. H. Zachary, “Neutron flux and energy characterization of a plutonium-beryllium isotopic neutron source by Monte Carlo simulation with verification by neutron activation analysis”. Las Vegas, USA: University of Nevada, 2010.
- N. A. Carrillo y H. R. Vega, “Cálculo de los espectros de neutrones de una fuente isotópica moderada”. Presentado en 5as Jornadas de Investigación de la UAZ, CB/UEN-10/042, 2001.
- B. Pelowitz, “MCNPX User’s Manual version 2.5.0 Los Alamos National Laboratory Report LA-UR-02-2607”. Presentado en Computation Topical Meeting, Avignon, France, 2005.