SentiFuzzy: Clasificador de sentimientos en Twitter basado en lógica difusa
Resumen
En el proceso de clasificación de sentimientos, la calidad de la polaridad varía en relación con las características o atributos que posee el clasificador y las del tuit que se analiza, por lo tanto, un clasificador de sentimiento logra su mayor calidad cuando se encuentra en escenarios en que sus características son similares a las características del tuit. En este artículo se presenta SentiFuzzy, un algoritmo que, a partir de la caracterización de atributos de cinco clasificadores de sentimientos reconocidos en la literatura, implementó una serie de reglas de inferencia y conjuntos difusos que permitió definir pesos matemáticos para cada clasificador y de esta manera saber qué clasificador debe ser seleccionado según la naturaleza del tuit analizado. Adicionalmente, dichos pesos se optimizaron a través del algoritmo Hill Climbing, lo que permitió obtener para algunos escenarios una exactitud de polaridad más alta que la reportada en el estado del arte y, en otros casos, una exactitud de polaridad competitiva frente a la polaridad reportada por los clasificadores comparados.
Palabras clave
análisis de sentimientos, clasificadores de polaridad, clasificadores de sentimientos, lógica difusa, polaridad, twitter
Citas
- M. Ahlgren, 55+ Twitter Statistics, Facts & Trends for 2023, 2023. https://www.websiterating.com/research/twitter-statistics/
- A. Ankit, N. Saleena, "An Ensemble Classification System for Twitter Sentiment Analysis," Procedia Computer Science, vol. 132, pp. 937-946, 2018. https://doi.org/10.1016/j.procs.2018.05.109
- S. Al-Azani, E.-S. M. El-Alfy, "Early and Late Fusion of Emojis and Text to Enhance Opinion Mining," IEEE Access, vol. 9, pp. 121031-121045, 2021. https://doi.org/10.1109/ACCESS.2021.3108502
- J. Anturi, et al., "Clasificadores para el Análisis de Sentimientos en Twitter: Una revisión," in Computer Science, Electronics and Industrial Engineering, 2019.
- D. H. Wahid, S. N. Azhari, Senti Strength ID, 2016. https://github.com/masdevid/sentistrength_id
- C. Hutto, E. Gilbert, "VADER: A Parsimonious Rule-based Model for Sentiment Analysis of Social Media Text," in Eighth International Conference on Web and SocialMedia, 2014. https://doi.org/10.1609/icwsm.v8i1.14550
- S.Tari, M. Basseur, A Goëffon, “Expansion-based Hill-climbing” Information Sciences, vol. 649, e119635, 2023. https://doi.org/10.1016/j.ins.2023.119635
- Microsoft, Text Analytics, 2023. https://azure.microsoft.com/en-us/services/cognitive-services/text-analytics/
- IBM, Natural Language Understanding, 2023 https://www.ibm.com/watson/services/natural-language-understanding/
- Geeksforgeeks, Tweepy, 2023. https://www.geeksforgeeks.org/twitter-sentiment-analysis-using-python/
- M. Araujo, iFeel Benchmarking Datasets, 2016. https://bitbucket.org/matheusaraujo/ifeel-benchmarking-datasets/src/master/
- Y. Sasaki, The Truth of the F-Measure, 2007. https://www.cs.odu.edu/~mukka/cs795sum09dm/Lecturenotes/Day3/F-measure-YS-26Oct07.pdf