Búsqueda avanzada

Mostrar el registro sencillo del ítem

dc.contributor.advisorMora Colque, Rensso Victor Hugo
dc.contributor.authorSantivañez Gutarra, Dan Joshua
dc.date.accessioned2025-03-06T21:56:53Z
dc.date.available2025-03-06T21:56:53Z
dc.date.issued2024
dc.identifier.citationSantivañez Gutarra, D. J. (2024). Exploración de modelos eficientes para la detección de violencia en videos de entornos reales mediante la destilación de conocimiento entre arquitecturas distintas: un enfoque para el prototipado rápido [Tesis de Maestría, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/417es_PE
dc.identifier.urihttps://hdl.handle.net/20.500.12815/417
dc.description.abstractLa detección de violencia en videos es un campo crucial dentro del análisis del comportamiento humano mediante tecnologías computacionales, especialmente en sistemas de videovigilancia. Este estudio propone un enfoque multinivel que combina técnicas avanzadas de preprocesamiento de datos y distilación de conocimiento para mejorar la eficiencia computacional y la capacidad de generalización de los modelos de detección de violencia. Se evalúan tres estrategias de preprocesamiento: extracción de personas en los frames, segmentación de personas, y detección de cajas delimitadoras. Se entrenan dos modelos preentrenados (MViTv2 y Swin3D b) utilizando tres bases de datos: RWF2000, RLVS y VioPeru, para seleccionar el modelo maestro más eficaz. Luego, se aplica distilacion de conocimiento a tres modelos estudiantes (S3D, Swin3D tiny y MC3-18) utilizando divergencia de Kullback-Leibler (KL) y su version adaptativa (AKL). Los modelos entrenados se evalúan en términos de precisión, tiempo de procesamiento y complejidad computacional, y se comparan en tareas de generalización utilizando diferentes bases de datos. Los resultados muestran que el modelo MViT alcanzo altos niveles de precisión y eficiencia, mientras que el modelo estudiante S3D, a pesar de su menor complejidad, mantuvo un rendimiento competitivo, demostrando la viabilidad de la distilacion de conocimiento como una estrategia eficaz para optimizar modelos en escenarios con recursos limitados. Este enfoque ofrece una solución práctica y eficiente para la implementación de sistemas de vigilancia autónomos en entornos reales.es_PE
dc.description.abstractViolence detection in videos is a crucial field within the analysis of human behavior through computational technologies, especially in video surveillance systems. This study proposes a multi-level approach that combines advanced data preprocessing techniques and knowledge distillation to improve the computational efficiency and generalization capacity of violence detection models. Three preprocessing strategies are evaluated: extracting people from individual frames, person segmentation, and bounding box detection. Two pretrained models (MViTv2 and Swin3D b) are trained on three datasets—RWF2000, RLVS, and VioPeru—to select the most effective “teacher” model. Subsequently, knowledge distillation is applied to three “student” models (S3D, Swin3D tiny, and MC3-18) using Kullback-Leibler (KL) divergence and its adaptive version (AKL). The trained models are evaluated in terms of accuracy, processing time, and computational complexity, and are also compared on generalization tasks using various datasets. The results show that the MViT model achieved high accuracy and efficiency, while the student model S3D, despite its lower complexity, maintained competitive performance. This demonstrates the feasibility of knowledge distillation as an effective strategy for optimizing models in resource-constrained scenarios. Overall, the proposed approach offers a practical and efficient solution for implementing autonomous surveillance systems in real-world settings.es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.language.isospaes_PE
dc.publisherUniversidad de Ingeniería y Tecnologíaes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.sourceRepositorio Institucional UTECes_PE
dc.sourceUniversidad de Ingeniería y Tecnología - UTECes_PE
dc.subjectPreprocesamiento de datoses_PE
dc.subjectAprendizaje continuoes_PE
dc.subjectPrevención de violenciaes_PE
dc.subjectVideovigilanciaes_PE
dc.subjectData preprocessinges_PE
dc.subjectMachine Learninges_PE
dc.subjectViolence preventiones_PE
dc.subjectVideo surveillancees_PE
dc.titleExploración de modelos eficientes para la detección de violencia en videos de entornos reales mediante la destilación de conocimiento entre arquitecturas distintas: un enfoque para el prototipado rápidoes_PE
dc.title.alternativeExploration of Efficient Models for Violence Detection in Real-World Video Environments through Cross-Architecture Knowledge Distillation: A Rapid Prototyping Approaches_PE
dc.typeinfo:eu-repo/semantics/masterThesises_PE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.02es_PE
dc.publisher.countryPEes_PE
thesis.degree.disciplineMaestría en Computer Sciencees_PE
thesis.degree.grantorUniversidad de Ingeniería y Tecnología. Escuela de Posgradoes_PE
thesis.degree.levelMaestríaes_PE
thesis.degree.nameMaestro en Computer Sciencees_PE
renati.advisor.dni42846291
renati.advisor.orcidhttps://orcid.org/0000-0003-4734-8752es_PE
renati.author.dni72623745
renati.author.orcidhttps://orcid.org/0000-0002-1868-1081es_PE
renati.discipline611016es_PE
renati.jurorCayllahua, Edward
renati.jurorFlores Benites, Victor
renati.jurorMora Colque, Rensso Victor Hugo
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_PE
renati.typehttps://purl.org/pe-repo/renati/type#tesises_PE


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(es)

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess
Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess