Keys for Analyzing Data on Twitter. Corpus Collection and Processing

Authors

  • Laura Bonilla CONICET - UBA

DOI:

https://doi.org/10.19053/0121053X.n39.2022.14283

Keywords:

methodology, digital discourse, Twitter, corpus construction, discourse analysis, netnography

Abstract

This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer
an accessible route that can be replicated in research with this type of data.

Downloads

Download data is not yet available.

References

Alcántara-Plá, M. (2020). Metodología híbrida para el análisis del discurso digital. El

ejemplo de «democracia» en Twitter. Cuadernos Aispi, 16, 25-44. https://doi.

org/10.14672/2.2020.1696

Álvarez-Bornstein, B., & Montesi, M. (2016). La comunicación entre investigadores en

Twitter. Una etnografía virtual en el ámbito de las ciencias de la documentación.

Revista Española de Documentación Científica, 39(4), 1-15. https://doi.

org/10.3989/redc.2016.4.1352

Arrieta, L. E. & Avendaño, G. (2018). El discurso del tuit: un análisis lingüístico,

sociodiscursivo y sociopragmático. Cuadernos de Lingüística Hispánica, 32,

-130. https://revistas.uptc.edu.co/index.php/linguistica_hispanica/article/

view/8123/6591

Authier-Revuz, J. (1984). Hétérogénéité(s) énonciative(s). Langages, 19(73), 98-111. DOI: https://doi.org/10.3406/lgge.1984.1167

Badillo-Mendoza, M. & Marta-Lazo, C. (2019). Ciberciudadanía a través de Twitter:

caso Gran Marcha Carnaval y consultas populares contra la minería en La

Colosa. Cuadernos.info, 45, 145-162. https://doi.org/10.7764/cdi.45.1454 DOI: https://doi.org/10.7764/cdi.45.1454

Beas, D. (2010). La reinvención de la política: Obama, internet y la nueva esfera

pública. Península.

Birdsell, D. S., & Groarke, L. (2007). Outlines of a Theory of Visual Argument. DOI: https://doi.org/10.1080/00028533.2007.11821666

Argumentation and Advocacy, 43(3-4), 103-113. https://doi.org/10.1080/0

2007.11821666

Bonilla-Neira, L. (2020). Tópicos y violencia verbal en la convocatoria a la marcha

#NoMásDesgobierno en Colombia. Revista de Estudos da Linguagem, 28(4),

-1777. https://doi.org/10.17851/2237-2083.28.4.1747-1777 DOI: https://doi.org/10.17851/2237-2083.28.4.1747-1777

Bonilla-Neira, L. (2021). Construcción de la imagen colectiva de grupos a favor del

Acuerdo de Paz de Colombia en Twitter. Revista de Estudos da Linguagem,

(4), 2225-2257. https://doi.org/10.17851/2237-2083.29.4.2225-2257 DOI: https://doi.org/10.17851/2237-2083.29.4.2225-2257

Bonilla-Neira, L. (2022). Polémica en Twitter por la “resistencia” al Acuerdo de Paz

en Colombia. En C. Pineira-Tresmontant (ed.), Dire et ne pas dire la violence

(pp. 113-130). L’Harmattan.

Calvo, E. (2015). Anatomía política de Twitter en Argentina. Capital Intelectual.

Castells, E. (2008, ene.-mar.). Los medios y la política. Revista TELOS, Revista de

Pensamiento, Sociedad y Tecnología, 1-15. https://telos.fundaciontelefonica.com/archivo/numero074/los-medios-y-la-politica/?output=pdf

Castells, M. (2009). La comunicación en la era digital. En Comunicación y poder (pp.

-189). Siglo XXI.

DataReportal. (2022). Twitter Stats and Trends. Essencial Twitter Stats for 2022.

https://datareportal.com/essential-twitter-stats

Del Fresno, M. (2011). Netnografía. Investigación, análisis e intervención social

online. Editorial UOC.

De Matteis, L. (2014). Ejes para un debate sobre el uso ético de datos interaccionales

escritos y orales obtenidos en línea. En Las humanidades digitales desde

Argentina. Tecnologías, culturas, saberes (pp. 235-247). Repositorio digital

UNS. https://repositoriodigital.uns.edu.ar/bitstream/handle/123456789/2851/

De-Matteis%2C L. Ejes para un debate....pdf?sequence=1&isAllowed=y

Freire, N. (2019). Por qué es Twitter el territorio político digital. Polis, 15(2), 39-74. DOI: https://doi.org/10.24275/uam/izt/dcsh/polis/2019v15n2/Freire

Gallardo-Paúls, B., Enguix-Oliver, S. & Oleaque-Moreno, J. (2018). Estilos de gestión de los perfiles políticos en Twitter: imagen y texto en las cuentas de los partidospolíticos en la campaña del 26J. Revista de Investigación Lingüística, 21, 15- 51. https://doi.org/https://doi.org/10.6018/ril.21.367371 DOI: https://doi.org/10.6018/ril.21.367371

Grossmann, F. (2019, 4 de feb.). Discours rapporté versus Discours partagé : convergences, différences, problèmes de frontières. En Conférence invitée dans le cadre du colloque Ci-dit, Université libre de Bruxelles. https://hal. archives-ouvertes.fr/hal-02005379

Hernández-Sampieri, R. & Mendoza-Torres, C. P. (2018). Metodología de la investigación. Las rutas cuantitativa, cualitativa y mixta. McGrawHill Education.

Hine, C. (2004). Etnografía virtual. En Etnografía virtual. Editorial UOC. https://doi.

org/10.1111/j.1468-5930.1987.tb00214.x

Honeycutt, C., & Herring, S. C. (2009). Beyond Microblogging : Conversation and

Collaboration via Twitter. In Proceedings of the Forty-Second Hawai’i International Conference on System Sciences (HICSS-42) (pp. 1-11). https://

doi.org/10.1109/HICSS.2009.89

Hürlimann, M., Davis, B., Cortis, K., Freitas, A., & Handschuh, S. (2016). A Twitter Sentiment Gold Standard for the Brexit Referendum. In Proceedings of the 12thInternational Conference on Semantic Systems (pp. 193-196). ACM. DOI: https://doi.org/10.1145/2993318.2993350

Kozinets, R. V. (2015). Netnography: Doing Ethnographic Research Online (2nd ed.). DOI: https://doi.org/10.1002/9781405165518.wbeos0782

Sage Publications.

Kreis, R. (2017). The “Tweet Politics” of President Trump. Journal of Language and DOI: https://doi.org/10.1075/jlp.17032.kre

Politics, 16(4), 607-618. https://doi.org/10.1075/jlp.17032.kre Longhi, J. (2013). Essai de caractérisation du tweet politique. L’information Grammaticale, 136, 25-32. DOI: https://doi.org/10.3406/igram.2013.4238

Mancera Rueda, A. & Pano Alamán, A. (2020). La opinión pública en la red. Análisis pragmático de la voz de ciudadanos. Iberoamericana/Vervuert. DOI: https://doi.org/10.31819/9783968690766

Marchal, N., Neudert, L. M., Kollanyi, B., & Howard, P. N. (2021). Investigating Visual Content Shared over Twitter During the 2019 EU Parliamentary Election Campaign. Media and Communication, 9(1), 158-170. https://doi. org/10.17645/mac.v9i1.3421 DOI: https://doi.org/10.17645/mac.v9i1.3421

Mazzuchino, M. G. (2020). El tuit como micropanfleto: el caso de la asunción del

nuevo presidente mexicano. Lexis, 44(2), 525-574. Open Refine. (2022). Open Refine. GitHub. https://github.com/OpenRefine/ OpenRefine#contact-us

Ott, B. L. (2017). The Age of Twitter: Donald J. Trump and the Politics of Debasement. DOI: https://doi.org/10.1080/15295036.2016.1266686

Critical Studies in Media Communication, 34(1), 59-68. https://doi.org/10.

/15295036.2016.1266686

Page, R., Barton, D., Unger, J. W., & Zappavigna, M. (2014). Researching Language

and Social Media. A Student Guide. Routledge.

Pallarés, S. & García, C. (2017). Análisis comparativo del discurso de Mariano Rajoy

en Twitter durante las dos campañas electorales de 2015 : las autonómicas del

M y las generales del 20D. Revista Dígitos, 3, 119-136.

Paveau, M.-A. (2017). L’analyse du discours numérique. Dictionnaire des formes et

des pratiques. Hermann.

Peirano, M. (2019). El enemigo conoce el sistema. Manipulación de ideas, personas

e influencias de la economía de la atención. Penguin Random House.

Robinson, L., & Schulz, J. (2014). New Avenues for Sociological Inquiry. August

https://doi.org/10.1177/0038038509105415 DOI: https://doi.org/10.1177/0038038509105415

Roque, G. (2016). Esquisse d’une rhétorique des interactions verbo-iconiques.

Open Edition Journals. https://doi.org/10.4000/imagesrevues.3434. DOI: https://doi.org/10.4000/imagesrevues.3434

Roque, G. (2017). Rhetoric, Argumentation, and Persuasion in a Multimodal Perspective. In A. Tseronis & C. Forceville (Eds.), Multimodal Argumentation and Rhetoric in Media Genres (p. 313). John Benajmins Publishing Company. DOI: https://doi.org/10.1075/aic.14.02roq

Rovira, G. (2019). Activismo en red y multitudes conectadas. Comunicación y

acción en la era de internet. Icaria- UAM-X.

Scolari, C. (2008). Hipermediaciones. Elementos para una teoría de la comunicación

digital interactiva. Gedisa.

Seixas, R., & Nascimento, L. (2021). Impeachment or Death: The Rhetorical

Configuration of a Polemic Event in the Digital Public Space. Revista de Estudos da Linguagem, 29(4), 2397-2428. https://doi.org/10.17851/2237- 2083.29.4.2397-2428

Slimovich, A. (2016). La digitalización de la política y la vuelta de lo televisivo. El caso de los candidatos argentinos en Facebook. Revista de Comunicación, 15, 111-127. http://udep.edu.pe/comunicacion/rcom/es/articulos/2016/6_

Art111-127.html

Squires, L. (2016). Twitter. Desing, Discourse, and the Implications of Public Text. In

A. Georgakopoulou & T. Spilioti (Eds.), The Routledge Handbook of Language

and Digital Communication (pp. 239-255). Routledge.

Sveningsson Elm, M. (2009). How Do Various Notions of Provacy Influence Decisions

In Qualitative Internet Research? In A. Markham & N. Baym (Eds.), Internet

Inquiry: Dialogue Among Researchers (pp. 69-98). Sage.

Twitter. (2020). Global Impact Report. https://about.twitter.com/content/dam/abouttwitter/

en/company/global-impact-2020.pdf

Van Dijck, J. (2016). La cultura de la conectividad. Una historia crítica de las redes

sociales. Siglo XXI.

Vasilachis de Gialdino, I. (2009). La investigación cualitativa. En I. Vasilachis de Gialdino (ed.), Estrategias de investigación cualitativa (pp. 23-64). Gedisa.

Ventura, A. (2018). ¿Cómo analizar discursos de 140 caracteres? Propuesta metodológica para el estudio del discurso estratégico con una perspectiva multimodal y crítica. CHIMERA: Revista de Corpus de Lenguas Romances y Estudios Lingüísticos, 5(2), 275-287. https://doi.org/10.15366/ DOI: https://doi.org/10.15366/chimera2018.5.2.006

chimera2018.5.2.006

Ventura, A. (2021). De presupuestos e implicaturas: las propuestas en la campaña

presidencial argentina 2015 en Twitter. REDD Revista Estudios del Discurso Digital , 4, 1-48. https://doi.org/10.24197/redd.4.2021.1-48 DOI: https://doi.org/10.24197/redd.4.2021.1-48

Zappavigna, M. (2011). Ambient Affiliation: A Linguistic Perspective on Twitter. New

Media and Society, 13(5). https://doi.org/10.1177/1461444810385097 DOI: https://doi.org/10.1177/1461444810385097

Zappavigna, M. (2012). Discourse of Twitter and Social Media. Continuum. https://

doi.org/10.11139/cj.31.3.412-414

Zappavigna, M. (2015). Searchable Talk : The Linguistic Functions of Hashtags. Social

Semiotics, 25(3), 274-291. https://doi.org/10.1080/10350330.2014.996948 DOI: https://doi.org/10.1080/10350330.2014.996948

Published

2022-07-18
Metrics
Views/Downloads
  • Abstract
    467
  • PDF (Español)
    281
  • XML (Español)
    1

How to Cite

Bonilla, L. (2022). Keys for Analyzing Data on Twitter. Corpus Collection and Processing. Cuadernos de Lingüística Hispánica, (39), 1–21. https://doi.org/10.19053/0121053X.n39.2022.14283

Issue

Section

Language and communication