Algoritmos de machine learning para la correlación de proyectos de investigación
Fecha
2024-07
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
UPEC
Resumen
Este proyecto de investigación presenta una respuesta a las demandas específicas
de los estudiantes con respecto a los trabajos de integración curricular, el mismo que
tributa a la investigación del SMART DATA LAB UPEC, en un entorno donde la
excelencia en el análisis y la comprensión de la literatura académica es crucial. La
singularidad de la propuesta radica en la experiencia de usuario que esta ofrece. En
lugar de someter a los investigadores a largas y monótonas listas de resultados, la
aplicación web brinda una interfaz visualmente atractiva y dinámica. Para la
extracción de datos se utilizó web scraping o raspado web que consiste en analizar
el código HTML de una página, en este caso a repositorios universitarios entre ellos la
Universidad Politécnica Estatal del Carchi, la Universidad del Pacifico, Universidad de
Azuay, la Universidad Internacional del Ecuador, Universidad Nacional de Loja y la
Universidad Espíritu Santo, de lo cual se extrajo datos relevantes, tales como la fecha,
tema de investigación, los autores y enlace de referencia, este proceso se llevó a
cabo mediante el desarrollo de scripts personalizados utilizando el lenguaje de
programación Python. También se aplicó en procesamiento del lenguaje natural
(PNL), ya que es crucial para la extracción, limpieza y trasformación de texto no
estructurado en datos estructurados que pueden ser utilizados por algoritmos
machine learning. Para la aplicación de algoritmos machine learning se incluyeron
algoritmos tales como el algoritmo k-Means para la agrupación de datos, así como
la Logistic Regression para la clasificación de información. En última instancia se
aplica el concepto de un coeficiente de correlación en el contexto de relaciones
numéricas entre las variables, donde se busca medir la fuerza y dirección de la
relación entre ellas.
Descripción
Palabras clave
SMART DATA LAB UPEC, web scraping, machine learning, coeficiente de correlación.
Citación
COM-131