Skip to main navigation menu Skip to main content Skip to site footer

Keys for Analyzing Data on Twitter. Corpus Collection and Processing

Abstract

This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data.

Keywords

methodology, digital discourse, Twitter, corpus construction, discourse analysis, netnography

PDF (Español) XML (Español)

References

  1. Alcántara-Plá, M. (2020). Metodología híbrida para el análisis del discurso digital. El ejemplo de «democracia» en Twitter. Cuadernos Aispi, 16, 25-44. https://doi.org/10.14672/2.2020.1696
  2. Álvarez-Bornstein, B., & Montesi, M. (2016). La comunicación entre investigadores en Twitter. Una etnografía virtual en el ámbito de las ciencias de la documentación. Revista Española de Documentación Científica, 39(4), 1-15. https://doi.org/10.3989/redc.2016.4.1352
  3. Arrieta, L. E. & Avendaño, G. (2018). El discurso del tuit: un análisis lingüístico, sociodiscursivo y sociopragmático. Cuadernos de Lingüística Hispánica, 32, 107-130. https://revistas.uptc.edu.co/index.php/linguistica_hispanica/article/view/8123/6591
  4. Authier-Revuz, J. (1984). Hétérogénéité(s) énonciative(s). Langages, 19(73), 98-111.
  5. Badillo-Mendoza, M. & Marta-Lazo, C. (2019). Ciberciudadanía a través de Twitter: caso Gran Marcha Carnaval y consultas populares contra la minería en La Colosa. Cuadernos.info, 45, 145-162. https://doi.org/10.7764/cdi.45.1454
  6. Beas, D. (2010). La reinvención de la política: Obama, internet y la nueva esfera pública. Península.
  7. Birdsell, D. S., & Groarke, L. (2007). Outlines of a Theory of Visual Argument. Argumentation and Advocacy, 43(3-4), 103-113. https://doi.org/10.1080/00028533.2007.11821666
  8. Bonilla-Neira, L. (2020). Tópicos y violencia verbal en la convocatoria a la marcha #NoMásDesgobierno en Colombia. Revista de Estudos da Linguagem, 28(4), 1747-1777. https://doi.org/10.17851/2237-2083.28.4.1747-1777
  9. Bonilla-Neira, L. (2021). Construcción de la imagen colectiva de grupos a favor del Acuerdo de Paz de Colombia en Twitter. Revista de Estudos da Linguagem, 29(4), 2225-2257. https://doi.org/10.17851/2237-2083.29.4.2225-2257
  10. Bonilla-Neira, L. (2022). Polémica en Twitter por la “resistencia” al Acuerdo de Paz en Colombia. En C. Pineira-Tresmontant (ed.), Dire et ne pas dire la violence (pp. 113-130). L’Harmattan.
  11. Calvo, E. (2015). Anatomía política de Twitter en Argentina. Capital Intelectual.
  12. Castells, E. (2008, ene.-mar.). Los medios y la política. Revista TELOS, Revista de Pensamiento, Sociedad y Tecnología, 1-15. https://telos.fundaciontelefonica.com/archivo/numero074/los-medios-y-la-politica/?output=pdf
  13. Castells, M. (2009). La comunicación en la era digital. En Comunicación y poder (pp. 87-189). Siglo XXI.
  14. DataReportal. (2022). Twitter Stats and Trends. Essencial Twitter Stats for 2022. https://datareportal.com/essential-twitter-stats
  15. Del Fresno, M. (2011). Netnografía. Investigación, análisis e intervención social online. Editorial UOC.
  16. De Matteis, L. (2014). Ejes para un debate sobre el uso ético de datos interaccionales escritos y orales obtenidos en línea. En Las humanidades digitales desde Argentina. Tecnologías, culturas, saberes (pp. 235-247). Repositorio digital UNS. https://repositoriodigital.uns.edu.ar/bitstream/handle/123456789/2851/De-Matteis%2CL.Ejesparaundebate....pdf?sequence=1&isAllowed=y
  17. Freire, N. (2019). Por qué es Twitter el territorio político digital. Polis, 15(2), 39-74.
  18. Gallardo-Paúls, B., Enguix-Oliver, S. & Oleaque-Moreno, J. (2018). Estilos de gestión de los perfiles políticos en Twitter: imagen y texto en las cuentas de los partidospolíticos en la campaña del 26J. Revista de Investigación Lingüística, 21, 15- 51. https://doi.org/https://doi.org/10.6018/ril.21.367371
  19. Grossmann, F. (2019, 4 de feb.). Discours rapporté versus Discours partagé : convergences, différences, problèmes de frontières. En Conférence invitée dans le cadre du colloque Ci-dit, Université libre de Bruxelles. https://hal.archives-ouvertes.fr/hal-02005379
  20. Hernández-Sampieri, R. & Mendoza-Torres, C. P. (2018). Metodología de la investigación. Las rutas cuantitativa, cualitativa y mixta. McGrawHill Education.
  21. Hine, C. (2004). Etnografía virtual. En Etnografía virtual. Editorial UOC. https://doi.org/10.1111/j.1468-5930.1987.tb00214.x
  22. Honeycutt, C., & Herring, S. C. (2009). Beyond Microblogging : Conversation and Collaboration via Twitter. In Proceedings of the Forty-Second Hawai’i International Conference on System Sciences (HICSS-42) (pp. 1-11). https://doi.org/10.1109/HICSS.2009.89
  23. Hürlimann, M., Davis, B., Cortis, K., Freitas, A., & Handschuh, S. (2016). A Twitter Sentiment Gold Standard for the Brexit Referendum. In Proceedings of the 12thInternational Conference on Semantic Systems (pp. 193-196). ACM.
  24. Kozinets, R. V. (2015). Netnography: Doing Ethnographic Research Online (2nd ed.). Sage Publications.
  25. Kreis, R. (2017). The “Tweet Politics” of President Trump. Journal of Language and Politics, 16(4), 607-618. https://doi.org/10.1075/jlp.17032.kre
  26. Longhi, J. (2013). Essai de caractérisation du tweet politique. L’information Grammaticale, 136, 25-32.
  27. Mancera Rueda, A. & Pano Alamán, A. (2020). La opinión pública en la red. Análisis pragmático de la voz de ciudadanos. Iberoamericana/Vervuert.
  28. Marchal, N., Neudert, L. M., Kollanyi, B., & Howard, P. N. (2021). Investigating Visual Content Shared over Twitter During the 2019 EU Parliamentary Election Campaign. Media and Communication, 9(1), 158-170. https://doi.org/10.17645/mac.v9i1.3421
  29. Mazzuchino, M. G. (2020). El tuit como micropanfleto: el caso de la asunción del nuevo presidente mexicano. Lexis, 44(2), 525-574. Open Refine. (2022). Open Refine. GitHub. https://github.com/OpenRefine/OpenRefine#contact-us
  30. Ott, B. L. (2017). The Age of Twitter: Donald J. Trump and the Politics of Debasement. Critical Studies in Media Communication, 34(1), 59-68. https://doi.org/10.1080/15295036.2016.1266686
  31. Page, R., Barton, D., Unger, J. W., & Zappavigna, M. (2014). Researching Language and Social Media. A Student Guide. Routledge.
  32. Pallarés, S. & García, C. (2017). Análisis comparativo del discurso de Mariano Rajoy en Twitter durante las dos campañas electorales de 2015 : las autonómicas del 24M y las generales del 20D. Revista Dígitos, 3, 119-136.
  33. Paveau, M.-A. (2017). L’analyse du discours numérique. Dictionnaire des formes et des pratiques. Hermann.
  34. Peirano, M. (2019). El enemigo conoce el sistema. Manipulación de ideas, personas e influencias de la economía de la atención. Penguin Random House.
  35. Robinson, L., & Schulz, J. (2014). New Avenues for Sociological Inquiry. August 2009. https://doi.org/10.1177/0038038509105415
  36. Roque, G. (2016). Esquisse d’une rhétorique des interactions verbo-iconiques. Open Edition Journals. https://doi.org/10.4000/imagesrevues.3434.
  37. Roque, G. (2017). Rhetoric, Argumentation, and Persuasion in a Multimodal Perspective. In A. Tseronis & C. Forceville (Eds.), Multimodal Argumentation and Rhetoric in Media Genres (p. 313). John Benajmins Publishing Company.
  38. Rovira, G. (2019). Activismo en red y multitudes conectadas. Comunicación y acción en la era de internet. Icaria- UAM-X.
  39. Scolari, C. (2008). Hipermediaciones. Elementos para una teoría de la comunicación digital interactiva. Gedisa.
  40. Seixas, R., & Nascimento, L. (2021). Impeachment or Death: The Rhetorical Configuration of a Polemic Event in the Digital Public Space. Revista de Estudos da Linguagem, 29(4), 2397-2428. https://doi.org/10.17851/2237-2083.29.4.2397-2428
  41. Slimovich, A. (2016). La digitalización de la política y la vuelta de lo televisivo. El caso de los candidatos argentinos en Facebook. Revista de Comunicación, 15, 111-127. http://udep.edu.pe/comunicacion/rcom/es/articulos/2016/6_Art111-127.html
  42. Squires, L. (2016). Twitter. Desing, Discourse, and the Implications of Public Text. In A. Georgakopoulou & T. Spilioti (Eds.), The Routledge Handbook of Language and Digital Communication (pp. 239-255). Routledge.
  43. Sveningsson Elm, M. (2009). How Do Various Notions of Provacy Influence Decisions In Qualitative Internet Research? In A. Markham & N. Baym (Eds.), Internet Inquiry: Dialogue Among Researchers (pp. 69-98). Sage.
  44. Twitter. (2020). Global Impact Report. https://about.twitter.com/content/dam/abouttwitter/en/company/global-impact-2020.pdf
  45. Van Dijck, J. (2016). La cultura de la conectividad. Una historia crítica de las redes sociales. Siglo XXI.
  46. Vasilachis de Gialdino, I. (2009). La investigación cualitativa. En I. Vasilachis de Gialdino (ed.), Estrategias de investigación cualitativa (pp. 23-64). Gedisa.
  47. Ventura, A. (2018). ¿Cómo analizar discursos de 140 caracteres? Propuesta metodológica para el estudio del discurso estratégico con una perspectiva multimodal y crítica. CHIMERA: Revista de Corpus de Lenguas Romances y Estudios Lingüísticos, 5(2), 275-287. https://doi.org/10.15366/chimera2018.5.2.006
  48. Ventura, A. (2021). De presupuestos e implicaturas: las propuestas en la campaña presidencial argentina 2015 en Twitter. REDD Revista Estudios del Discurso Digital , 4, 1-48. https://doi.org/10.24197/redd.4.2021.1-48
  49. Zappavigna, M. (2011). Ambient Affiliation: A Linguistic Perspective on Twitter. New Media and Society, 13(5). https://doi.org/10.1177/1461444810385097
  50. Zappavigna, M. (2012). Discourse of Twitter and Social Media. Continuum. https://doi.org/10.11139/cj.31.3.412-414
  51. Zappavigna, M. (2015). Searchable Talk : The Linguistic Functions of Hashtags. Social Semiotics, 25(3), 274-291. https://doi.org/10.1080/10350330.2014.996948

Downloads

Download data is not yet available.

Similar Articles

1 2 3 4 5 6 7 8 9 10 > >> 

You may also start an advanced similarity search for this article.