Keys for Analyzing Data on Twitter. Corpus Collection and Processing
Abstract
This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data.
Keywords
methodology, digital discourse, Twitter, corpus construction, discourse analysis, netnography
References
- Alcántara-Plá, M. (2020). Metodología híbrida para el análisis del discurso digital. El ejemplo de «democracia» en Twitter. Cuadernos Aispi, 16, 25-44. https://doi.org/10.14672/2.2020.1696
- Álvarez-Bornstein, B., & Montesi, M. (2016). La comunicación entre investigadores en Twitter. Una etnografía virtual en el ámbito de las ciencias de la documentación. Revista Española de Documentación Científica, 39(4), 1-15. https://doi.org/10.3989/redc.2016.4.1352
- Arrieta, L. E. & Avendaño, G. (2018). El discurso del tuit: un análisis lingüístico, sociodiscursivo y sociopragmático. Cuadernos de Lingüística Hispánica, 32, 107-130. https://revistas.uptc.edu.co/index.php/linguistica_hispanica/article/view/8123/6591
- Authier-Revuz, J. (1984). Hétérogénéité(s) énonciative(s). Langages, 19(73), 98-111.
- Badillo-Mendoza, M. & Marta-Lazo, C. (2019). Ciberciudadanía a través de Twitter: caso Gran Marcha Carnaval y consultas populares contra la minería en La Colosa. Cuadernos.info, 45, 145-162. https://doi.org/10.7764/cdi.45.1454
- Beas, D. (2010). La reinvención de la política: Obama, internet y la nueva esfera pública. Península.
- Birdsell, D. S., & Groarke, L. (2007). Outlines of a Theory of Visual Argument. Argumentation and Advocacy, 43(3-4), 103-113. https://doi.org/10.1080/00028533.2007.11821666
- Bonilla-Neira, L. (2020). Tópicos y violencia verbal en la convocatoria a la marcha #NoMásDesgobierno en Colombia. Revista de Estudos da Linguagem, 28(4), 1747-1777. https://doi.org/10.17851/2237-2083.28.4.1747-1777
- Bonilla-Neira, L. (2021). Construcción de la imagen colectiva de grupos a favor del Acuerdo de Paz de Colombia en Twitter. Revista de Estudos da Linguagem, 29(4), 2225-2257. https://doi.org/10.17851/2237-2083.29.4.2225-2257
- Bonilla-Neira, L. (2022). Polémica en Twitter por la “resistencia” al Acuerdo de Paz en Colombia. En C. Pineira-Tresmontant (ed.), Dire et ne pas dire la violence (pp. 113-130). L’Harmattan.
- Calvo, E. (2015). Anatomía política de Twitter en Argentina. Capital Intelectual.
- Castells, E. (2008, ene.-mar.). Los medios y la política. Revista TELOS, Revista de Pensamiento, Sociedad y Tecnología, 1-15. https://telos.fundaciontelefonica.com/archivo/numero074/los-medios-y-la-politica/?output=pdf
- Castells, M. (2009). La comunicación en la era digital. En Comunicación y poder (pp. 87-189). Siglo XXI.
- DataReportal. (2022). Twitter Stats and Trends. Essencial Twitter Stats for 2022. https://datareportal.com/essential-twitter-stats
- Del Fresno, M. (2011). Netnografía. Investigación, análisis e intervención social online. Editorial UOC.
- De Matteis, L. (2014). Ejes para un debate sobre el uso ético de datos interaccionales escritos y orales obtenidos en línea. En Las humanidades digitales desde Argentina. Tecnologías, culturas, saberes (pp. 235-247). Repositorio digital UNS. https://repositoriodigital.uns.edu.ar/bitstream/handle/123456789/2851/De-Matteis%2CL.Ejesparaundebate....pdf?sequence=1&isAllowed=y
- Freire, N. (2019). Por qué es Twitter el territorio político digital. Polis, 15(2), 39-74.
- Gallardo-Paúls, B., Enguix-Oliver, S. & Oleaque-Moreno, J. (2018). Estilos de gestión de los perfiles políticos en Twitter: imagen y texto en las cuentas de los partidospolíticos en la campaña del 26J. Revista de Investigación Lingüística, 21, 15- 51. https://doi.org/https://doi.org/10.6018/ril.21.367371
- Grossmann, F. (2019, 4 de feb.). Discours rapporté versus Discours partagé : convergences, différences, problèmes de frontières. En Conférence invitée dans le cadre du colloque Ci-dit, Université libre de Bruxelles. https://hal.archives-ouvertes.fr/hal-02005379
- Hernández-Sampieri, R. & Mendoza-Torres, C. P. (2018). Metodología de la investigación. Las rutas cuantitativa, cualitativa y mixta. McGrawHill Education.
- Hine, C. (2004). Etnografía virtual. En Etnografía virtual. Editorial UOC. https://doi.org/10.1111/j.1468-5930.1987.tb00214.x
- Honeycutt, C., & Herring, S. C. (2009). Beyond Microblogging : Conversation and Collaboration via Twitter. In Proceedings of the Forty-Second Hawai’i International Conference on System Sciences (HICSS-42) (pp. 1-11). https://doi.org/10.1109/HICSS.2009.89
- Hürlimann, M., Davis, B., Cortis, K., Freitas, A., & Handschuh, S. (2016). A Twitter Sentiment Gold Standard for the Brexit Referendum. In Proceedings of the 12thInternational Conference on Semantic Systems (pp. 193-196). ACM.
- Kozinets, R. V. (2015). Netnography: Doing Ethnographic Research Online (2nd ed.). Sage Publications.
- Kreis, R. (2017). The “Tweet Politics” of President Trump. Journal of Language and Politics, 16(4), 607-618. https://doi.org/10.1075/jlp.17032.kre
- Longhi, J. (2013). Essai de caractérisation du tweet politique. L’information Grammaticale, 136, 25-32.
- Mancera Rueda, A. & Pano Alamán, A. (2020). La opinión pública en la red. Análisis pragmático de la voz de ciudadanos. Iberoamericana/Vervuert.
- Marchal, N., Neudert, L. M., Kollanyi, B., & Howard, P. N. (2021). Investigating Visual Content Shared over Twitter During the 2019 EU Parliamentary Election Campaign. Media and Communication, 9(1), 158-170. https://doi.org/10.17645/mac.v9i1.3421
- Mazzuchino, M. G. (2020). El tuit como micropanfleto: el caso de la asunción del nuevo presidente mexicano. Lexis, 44(2), 525-574. Open Refine. (2022). Open Refine. GitHub. https://github.com/OpenRefine/OpenRefine#contact-us
- Ott, B. L. (2017). The Age of Twitter: Donald J. Trump and the Politics of Debasement. Critical Studies in Media Communication, 34(1), 59-68. https://doi.org/10.1080/15295036.2016.1266686
- Page, R., Barton, D., Unger, J. W., & Zappavigna, M. (2014). Researching Language and Social Media. A Student Guide. Routledge.
- Pallarés, S. & García, C. (2017). Análisis comparativo del discurso de Mariano Rajoy en Twitter durante las dos campañas electorales de 2015 : las autonómicas del 24M y las generales del 20D. Revista Dígitos, 3, 119-136.
- Paveau, M.-A. (2017). L’analyse du discours numérique. Dictionnaire des formes et des pratiques. Hermann.
- Peirano, M. (2019). El enemigo conoce el sistema. Manipulación de ideas, personas e influencias de la economía de la atención. Penguin Random House.
- Robinson, L., & Schulz, J. (2014). New Avenues for Sociological Inquiry. August 2009. https://doi.org/10.1177/0038038509105415
- Roque, G. (2016). Esquisse d’une rhétorique des interactions verbo-iconiques. Open Edition Journals. https://doi.org/10.4000/imagesrevues.3434.
- Roque, G. (2017). Rhetoric, Argumentation, and Persuasion in a Multimodal Perspective. In A. Tseronis & C. Forceville (Eds.), Multimodal Argumentation and Rhetoric in Media Genres (p. 313). John Benajmins Publishing Company.
- Rovira, G. (2019). Activismo en red y multitudes conectadas. Comunicación y acción en la era de internet. Icaria- UAM-X.
- Scolari, C. (2008). Hipermediaciones. Elementos para una teoría de la comunicación digital interactiva. Gedisa.
- Seixas, R., & Nascimento, L. (2021). Impeachment or Death: The Rhetorical Configuration of a Polemic Event in the Digital Public Space. Revista de Estudos da Linguagem, 29(4), 2397-2428. https://doi.org/10.17851/2237-2083.29.4.2397-2428
- Slimovich, A. (2016). La digitalización de la política y la vuelta de lo televisivo. El caso de los candidatos argentinos en Facebook. Revista de Comunicación, 15, 111-127. http://udep.edu.pe/comunicacion/rcom/es/articulos/2016/6_Art111-127.html
- Squires, L. (2016). Twitter. Desing, Discourse, and the Implications of Public Text. In A. Georgakopoulou & T. Spilioti (Eds.), The Routledge Handbook of Language and Digital Communication (pp. 239-255). Routledge.
- Sveningsson Elm, M. (2009). How Do Various Notions of Provacy Influence Decisions In Qualitative Internet Research? In A. Markham & N. Baym (Eds.), Internet Inquiry: Dialogue Among Researchers (pp. 69-98). Sage.
- Twitter. (2020). Global Impact Report. https://about.twitter.com/content/dam/abouttwitter/en/company/global-impact-2020.pdf
- Van Dijck, J. (2016). La cultura de la conectividad. Una historia crítica de las redes sociales. Siglo XXI.
- Vasilachis de Gialdino, I. (2009). La investigación cualitativa. En I. Vasilachis de Gialdino (ed.), Estrategias de investigación cualitativa (pp. 23-64). Gedisa.
- Ventura, A. (2018). ¿Cómo analizar discursos de 140 caracteres? Propuesta metodológica para el estudio del discurso estratégico con una perspectiva multimodal y crítica. CHIMERA: Revista de Corpus de Lenguas Romances y Estudios Lingüísticos, 5(2), 275-287. https://doi.org/10.15366/chimera2018.5.2.006
- Ventura, A. (2021). De presupuestos e implicaturas: las propuestas en la campaña presidencial argentina 2015 en Twitter. REDD Revista Estudios del Discurso Digital , 4, 1-48. https://doi.org/10.24197/redd.4.2021.1-48
- Zappavigna, M. (2011). Ambient Affiliation: A Linguistic Perspective on Twitter. New Media and Society, 13(5). https://doi.org/10.1177/1461444810385097
- Zappavigna, M. (2012). Discourse of Twitter and Social Media. Continuum. https://doi.org/10.11139/cj.31.3.412-414
- Zappavigna, M. (2015). Searchable Talk : The Linguistic Functions of Hashtags. Social Semiotics, 25(3), 274-291. https://doi.org/10.1080/10350330.2014.996948