Testing for Normality in Geostatistics. A New Approach Based on the Mahalanobis Distance

Testing for Normality in Geostatistics. A New Approach Based on the Mahalanobis Distance A discussion on the use of univariate normality tests in this context

Contenido principal del artículo

Ramón Giraldo
Emilio Porcu

Resumen

En geoestadística, bajo estacionariedad, kriging simple (KS) es el mejor predictor lineal (MPL) y kriging ordinario (KO) es el mejor predictor lineal insesgado (MPLI). Cuando el proceso estocástico es Normal, KS no es solo un MPL sino un mejor predictor (MP), es decir que bajo la función de pe´rdida cuadrática, éste coincide con la esperanza condicional del predictor dada la información. En este escenario, el predictor KO sirve como aproximación del MP. Por esta razón, en geoestadística aplicada, es importante probar el supuesto de normalidad. Dada una realización de un proceso espacial, KS será un predictor óptimo si el vector aleatorio subyacente sigue una distribución normal multivariada. Algunas pruebas de normalidad clásicas como Shapiro-Wilk (SW), Shapiro-Francia (SF), o Anderson-Darling (AD) son usadas para evaluar
este supuesto. Estas asumen independencia y por ello no son apropiadas en geoestadística (y en general en estadística espacial). Por un lado, las observaciones en geoestadística son espacialmente correlacionadas. Por otro lado la optimalidad del kriging es fundamentada en normalidad multivariada (no en normalidad univariada). En este trabajo se presenta un estudio de simulación para mostrar por qué es inapropiado el uso de pruebas univaridas de normalidad con datos geoestadísticos. También, como solución al problema anterior, se propone una adaptación de la prueba de Mahalanobis al contexto geoestadístico para hacer de manera correcta el test de normalidad en este am´bito.

Palabras clave:

Descargas

Los datos de descargas todavía no están disponibles.

Detalles del artículo

Referencias (VER)

G. Robertson. “Geostatistics in ecology: interpolating with known variance ”. Ecology, vol. 68, no. 3,

pp 744-748, 1987.

T. Hooks, D. Marx, S. Kachman, J. Pedersen, R. Eigenberg, R. “Analysis of covariance with spatially

correlated secondary variables ”. Revista Colombiana de Estadística, vol. 31, no. 1, pp. 95-109, 2008.

G. Severino, M. Scarfato, G. Toraldo. “Mining geostatistics to quantify the spatial variability of certain

soil flow properties ”. Procedia Computer Science, vol. 98, 419-424, 2016.

I. Gundogdu. “Usage of multivariate geostatistics in interpolation processes for meteorological precipitation

maps ”. Theoretical and Applied Climatology, vol. 127, no. 1-2, 81-86, 2017.

R. Giraldo, L. Herrera, V. Leiva. “Cokriging prediction using as secondary variable a functional random

field with application in environmental pollution ”. Mathematics, vol. 8, no.8, 1305, 2020.

M. Oliver, R. Webster. Basic steps in geostatistics: The variogram and kriging. Springer. 2015.

E. Lehmann, G. Casella. Theory of Point Estimation. Springer-Verlag, 1998.

J. Chiles, P. Delfiner. Geostatistics: Modeling Spatial Uncertainty. John Wiley & Sons, 1999.

O. Schabenberger, C. Gotway. Statistical Methods for Spatial Data Analysis. Chapman & Hall, 2005.

D. McGratha, C. Zhangb, O. Cartona. “Geostatistical analysis and hazard assessment on soil lead in

silvermines area, Ireland ”. Environmental Pollution, vol. 127, 239-248, 2004.

V. Júnior, M. Carvalho, J. Dafonte, O. Freddi, E. Vidal, O. Ingaramoc. “Spatial variability of soil water

content and mechanical resistance of Brazilian ferralsol ”. Soil & Tillage Research, vol. 85, 166-177,

A. Dexter, A. Czyz, O. Gate. “A method for prediction of soil penetration resistance ”. Soil & Tillage

Research, vol. 93, 412-419, 2007.

K. Kamarudin, M. Tomita M, K. Kondo, S. Abe. “Geostatistical estimation of surface soil carbon stock

in Mt. Wakakusa grassland of Japan ”. Landscape and Ecological Engineering, vol. 15, no.2, 215-221,

J. Iqbal, J. Thomasson, J. Jenkins, P. Owens, Whisler, F. “Spatial variability analysis of soil physical

properties of alluvial soils ”. Soil Science Society of America Journal, vol. 69, 1338-1350, 2005.

L. Pozdnyakova, D. Giménez, P. Oudemans. “Spatial analysis of cranberry yield at three scales ”.

Agronomy Journal, vol. 97, 49-57, 2005.

M. Carrara, A. Castrignano, A. Comparetti, P. Febo, S. Orlando. “Mapping of Penetrometer Resistance

in Relation to Tractor Traffic Using Multivariate Geostatistics ”. Geoderma, vol. 142, 294-307, 2007.

J. Lima, S. Silva. “Multivariate analysis and geostatistics of the fertility of a humic rhodic hapludox

under coffee cultivation ”. Revista Brasileira de Ciencia do Solo, vol. 36, no. 2, 467-474, 2012.

E. Barca, D. De Benedetto, A. Stellaccic. “Contribution of EMI and GPR proximal sensing data in

soil water content assessment by using linear mixed effects models and geostatistical approaches ”.

Geoderma, vol. 343, no. 1, 280-293, 2019.

E. Pardo-Igúzquiza, P. Dowd. “Normality tests for spatially correlated data ”. Mathematical Geology,

vol. 36, no. 6, 659-681, 2004.

R. Olea, V. Pavlosky. “Kolmogorov-Smirnov test for spatially correlated data ”. Stochastic Environmental

Research and Risk Assessment, vol. 23, no.6, 749-757, 2008.

K. Mardia. “Measures of multivariate skewness and kurtosis with applications ”. Biometrika. vol. 57,

no. 3, 519-530, 1970.

G.Szekely, M. Rizzo. “A new test for multivariate normality ”. Journal of Multivariate Analysis. vol. 93,

-80, 2005.

T. Anderson. An Introduction to Multivariate Statistical Analysis. John Wiley & Sons, 1984.

N. Cressie. Statistic for Spatial Data. John Wiley & Sons, 1993.

P. Diggle, P. Ribeiro. Model-Based Geostatistics. 14th Simposio Nacional de Probabilidade e Estatística,

Associacao Brasileira de Estatística, 2000.

P. Diggle, P. Ribeiro. Model-Based Geostatistics. Springer, 2007.

E. Lehmann, G. Casella. Theory of Point Estimation. Springer-Verlag, 1998.

I. Cardoso De Oliveira, D. Ferreira. “Multivariate extension of Chi-squared univariate normality test ”.

Journal of Statistical Computation and Simulation. vol. 80, no. 5, 513-526, 2010.

R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical

Computing, Vienna, Austria. URL https://www.R-project.org/. 2019.

P. Ribeiro, P. Diggle. “geoR: A package for geostatistical analysis ”. Journal of Statistical Computation

and Simulation. vol. 1, no. 2, 14-18, 2007.

E. Pebesma, R. Bivand. “S classes and methods for spatial data: The sp package ”. R news, vol. 5, no.

, 9-13, 2005.

J. Gross, U. Ligges. nortest: Tests for Normality. R package version 1.0-4, URL https: //CRAN.Rproject.

org/package=nortest. 2015.

Dudewicz E, Mishra S. Modern Mathematical Statistics. John Wiley & Sons, 1988.

H. R. Vega, E. Manzanares, V.M. Hernández, G. A. Mercado, E. Gallego y A. Lorente,

“Características dosimétricas de fuentes isotópicas de neutrones”, Revista Mexicana de Física, vol.

, no. 5, pp. 494-501, 2005.

H. R. Vega y C. Torres, “Low energy neutrons from a 239PuBe isotopic neutron source inserted in

moderating media”, Revista Mexicana de Física, vol. 48, no. 5, pp. 405-412, 2002.

N. C. Tam, J. Bagi y L. Lakosi, “Determining Pu isotopic composition and Pu content of PuBe sources

by neutron coincidence technique”, Nuclear Instruments and Methods in Physics Research, vol. 262,

pp. 75-80, 2007.

I. ElAgib, J. Csikai, J. Jordanova y L. OlaAh, “Leakage neutron spectra from spherical samples with a

Pu-Be source”, Applied Radiation and Isotopes, vol. 51, pp. 329-333, 1999.

J. Bagi, N. C. Tam y L. Lakosi, “Assessment of the Pu content of Pu-Be neutron sources”, Nuclear

Instruments and Methods in Physics Research, vol. 222, pp. 242-248, 2004.

R. H. Zachary, “Neutron flux and energy characterization of a plutonium-beryllium isotopic neutron

source by Monte Carlo simulation with verification by neutron activation analysis”. Las Vegas, USA:

University of Nevada, 2010.

N. A. Carrillo y H. R. Vega, “Cálculo de los espectros de neutrones de una fuente isotópica moderada”.

Presentado en 5as Jornadas de Investigación de la UAZ, CB/UEN-10/042, 2001.

B. Pelowitz, “MCNPX User’s Manual version 2.5.0 Los Alamos National Laboratory Report LA-UR-

-2607”. Presentado en Computation Topical Meeting, Avignon, France, 2005.

Citado por: