Búsqueda avanzada

Mostrar el registro sencillo del ítem

dc.contributor.advisorLópez del Álamo, Cristian José
dc.contributor.authorVelásquez Gushiken, Andrea
dc.date.accessioned2023-04-14T21:00:45Z
dc.date.available2023-04-14T21:00:45Z
dc.date.issued2023
dc.identifier.citationVelásquez Gushiken, A. (2023). Análisis de los métodos de recolección de textos sarcásticos [Tesis de Título Profesional, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/307es_PE
dc.identifier.urihttps://hdl.handle.net/20.500.12815/307
dc.description.abstractLa detección de sarcasmo es un obstáculo particularmente complicado de resolver dentro del Procesamiento de Lenguaje Natural. En los últimos años se han propuesto mejoras en la arquitectura y funcionamiento de los modelos que buscan resolver el problema. No obstante, se ha dejado del lado la importancia de los textos sarcásticos que se utilizan para entrenarlos y, con ella, los métodos de recolección de estos textos. Los métodos tradicionales producen datasets sesgados, con errores y ruidosos, y no distinguen entre los dos tipos de sarcasmo: intencional y percibido. Por ello, en la presente investigación, se analiza cuantitativamente el impacto que tienen los métodos de recolección de datasets sarcásticos en inglés en los modelos de detección de sarcasmo. Con este fin, se hace uso de datasets públicos y se generan dos nuevos datasets con el método de Supervisión Reactiva (Shmueli et al., 2020) para analizar el impacto de los distintos métodos de recolección en el desempeño de modelos de detección de sarcasmo. Se realiza una comparación detallada de los métodos, entrenando modelos en el estado del arte con un dataset representativo de cada uno de ellos. Los resultados sugieren que es posible obtener mejores resultados en los modelos de detección de sarcasmo utilizando un método que provea un dataset limpio y el mismo tipo de sarcasmo que el que se quiere detectar. A su vez, confirman los descubrimientos realizados en investigaciones anteriores, y abren el camino a trabajos futuros.es_PE
dc.description.abstractSarcasm Detection is a particularly complex setback in Natural Language Processing. In the last years, there have been improvements in the architecture and functionality of models that try to solve the problem. However, the importance of the sarcastic texts used to train the models has been left aside, as well as their collection methods. The traditional methods generate biased and noisy datasets with errors, and do not differentiate the two types of sarcasm: intentional and perceived. In consequence, the current investigation does a quantitative analysis on the impact that collection methods of sarcastic datasets in English have on sarcasm detection models. For that purpose, the investigation uses public datasets and generates two new datasets with the Reactive Supervision method (Shmueli et al., 2020) to analyze the impact of the collection methods on the performance of sarcasm detection models. It makes a detailed comparison of the methods, training state-of-the-art models with a representative dataset of each one of them. The results suggest that it is possible to obtain better models using a method that provides a clean dataset and the type of sarcasm to be detected. At the same time, they confirm the findings made by previous investigations and open a path to future works.es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.language.isospaes_PE
dc.publisherUniversidad de Ingeniería y Tecnologíaes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.sourceRepositorio Institucional UTECes_PE
dc.sourceUniversidad de Ingeniería y Tecnología - UTECes_PE
dc.subjectAnálisis de Sentimientoses_PE
dc.subjectDetección de sarcasmoes_PE
dc.subjectProcesamiento de Lenguaje Naturales_PE
dc.subjectExtracción de datoses_PE
dc.subjectSarcasmoes_PE
dc.subjectNatural Language Processinges_PE
dc.subjectSentiment Analysises_PE
dc.subjectSarcasm Detectiones_PE
dc.subjectDATA extractiones_PE
dc.subjectSarcasmes_PE
dc.titleAnálisis de los métodos de recolección de textos sarcásticoses_PE
dc.title.alternativeAnalysis of sarcasm collection methodses_PE
dc.typeinfo:eu-repo/semantics/bachelorThesises_PE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.02es_PE
dc.publisher.countryPEes_PE
thesis.degree.disciplineCiencia de la Computaciónes_PE
thesis.degree.grantorUniversidad de Ingeniería y Tecnología. Ciencia de la Computaciónes_PE
thesis.degree.levelTítulo Profesionales_PE
thesis.degree.nameLicenciada en Ciencia de la Computaciónes_PE
renati.advisor.dni29708892
renati.advisor.orcidhttps://orcid.org/0000-0002-2568-650Xes_PE
renati.author.dni71950741
renati.author.orcidhttps://orcid.org/0000-0002-0039-3663es_PE
renati.discipline611016es_PE
renati.jurorSerrano Llerena, Yamilet Rosario
renati.jurorSoriano Vargas, Aurea
renati.jurorLópez del Álamo, Cristian José
renati.levelhttp://purl.org/pe-repo/renati/level#tituloProfesionales_PE
renati.typehttp://purl.org/pe-repo/renati/type#tesises_PE


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(es)

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess
Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess