Nombre y apellidos: Gabriel Blanco García Correo electrónico: [email protected]
Nombre y apellidos: Michelle Ferrín Meilá Correo electrónico: [email protected]
El objetivo del trabajo es emplear técnicas de Machine Learning, text mining y procesamiento de lenguaje natural con el fin de implementar modelos que permitan analizar y predecir los sentimientos de consumidores, basándose en textos de reseñas. Se utilizan reseñas de películas del imbd. El dataset empleado puede encontrarse en el siguiente enlace: https://www.kaggle.com/lakshmi25npathi/imdb-dataset-of-50k-movie-reviews. Se emplean los modelos habituales de Machine Learning, y redes neuronales básicas. El programa que se utiliza es Python, y algunas de las librerías que se emplean son pandas, scikit-learn, nltk, re, keras, tensorflow y shap.
Información sobre las carpetas y su contenido:
-
Data: carpetas con los directorios de los datos del trabajo, están vacías para poder subirlas.
-
Environment: contiene el entorno utilizado para el trabajo.
-
html: los notebooks del trabajo, guardados en formato html.
-
models: contiene la carpeta trained_models, con las carpetas classifiers y neural_networks. Cada una de ellas destinada a almacenar los modelos entrenados, o redes neuronales y sus pesos. La carpeta está vacía en la subida.
-
notebooks : cada uno de los notebooks del trabajo, ordenados en función del flujo de trabajo que ha seguido el proyecto
-
references: contiene un archivo con las referencias y el material empleado en el trabajo.
-
src: contiene varios archivos con las funciones que se programan y utilizan a lo largo del trabajo.