Modelo Bivariado para las Pruebas Saber11 en el Departamento Del Tolima (Colombia)

Contenido principal del artículo

Autores

YURI MARCELA GARCIA S.
JAIRO ALFONSO CLAVIJO M.
OSCAR ANDRES LUGO C.

Resumen

En muchas aplicaciones encontramos datos que se restringen al intervalo (0;1), tales como porcentajes y proporciones, y que además pueden ser explicados por otras variables a través de un modelo de regresión en el que la variable respuesta está distribuida como una beta. Por otro lado, se encuentran pares de variables que tienen cierta dependencia como es el caso del rendimiento en matemáticas y lectura crítica dados en las pruebas saber11 en el departamento del Tolima (Colombia) 2016. La teoría de las funciones cópula surgen como una alternativa para medir la dependencia de variables aleatorias con distribuciones marginales dadas, permitiendo estimar diferentes medidas de asociación y diferentes métodos de estimación. En este artículo se usó un Modelo Bivariado bajo el contexto de las funciones Cópula para datos que están en el intervalo (0;1). Se verificaron las propiedades de los modelos ajustados y se compararon diferentes métodos de estimaciones usando el paquete Cópula y VineCopula del software R con el fin de establecer cuál es el mejor. Se usaron datos simulados para realizar este proceso y se aplicaron los modelos a datos reales de rendimiento en lectura crítica y matemáticas en estudiantes entre los 14 a 24 años.

Palabras clave:

Detalles del artículo

Referencias

[1] Agresti, A. (2002). Categorical Data Analysis. John Wiley and Sons, Hoboken, New Jersey.

[2] Bustos, O. y Guerrero, A. (2011). Breve Introducción a la Matemática de la Estadística Espacial. Sociedad Brasileña de Matemática. Ensayos Matemáticos. 20, 1-115.

[3] Casella, G. y Berger, R. (2002). Statistical Inference. Duxbury Press, Belmont, CA.

[4] Cepeda-Cuervo, E. (2001) Modelagem da Variabilidade em Modelos Lineares Generalizados (unplublished PhD tesis). Universidade Federal de Rio de Janeiro, Rio de Janeiro.

[5] Cepeda-Cuervo, E., Achcar, J. and Lopera, L. (2012). Bivariate Beta Regression Models: a Bayesian Approach appliedto educational data. Monograph (technical report). Not published. [available at: ]. Retrieved on May 10, 2014.

[6] Cepeda-Cuervo, E. and Núñez-Antón, V. (2013). Spatial double generalized beta regression models: Extensions and application to study quality of education in Colombia. Journal of Educational and Behavioral Statistics. 38 (6), 604-628.

[7] Cribari-Neto, F. and Zeileis, A. (2010). Beta regression in R. Journal of Statistical Software, 34(2), 1-23.

[8] Cribari-Neto, F. and Souza, T. (2011). Testing inference in variable dispersion beta regression. Journal of Statistical Computation and Simulation, iFirst: 1-17.

[9] Erley, A. (2009). Cópulas y dependencia de variables aleatórias: Una introducción. Miscelánea Matemática. 48, 7-28.
[10] Eskelson, B., Madsen, L., Hagan, J. and Temesgen, H. (2010). Estimating riparian understory vegetation cover with beta regression and copula models. Forest Science, 57 (3), 212-221.

[11] Ferrari, S. and Cribari-Neto, F. (2004). Beta regression for modelling rates and proportions. Journal of Applied Statistics, 31(7), 799-815.

[12] McCullagh, P. and Nelder, J. (1989). Generalized Linear Models. Chapman and Hall, London.

[13] Nelsen, R. (1999). An introduction to Copulas. Springer. New York.

[14] Ospina, R. and Ferrari, S. (2012). A General class of zero - or - one inflated beta regression models. Journal of Computational Statistical and Data Analysis, 56(6), 1609-1623.

[15] R-Team (2014). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria.

[16] Sklar, A. (1959). Fonctions de répartition á n dimensions et leurs marges. Inst. Statist. Univ. Paris Publ. 8, 229-231.

[17] Smithson, M and Verkuilen, J. (2006). A better lemon squeezer maximum-likelihood regression with beta-distributed dependent variables. Psychological Methods. Vol 11 No. 1, 54-71.

Descargas

La descarga de datos todavía no está disponible.