![](https://www.notion.so/images/page-cover/met_william_morris_1878.jpg)
Minería de datos con enfoque en Procesamiento de lenguaje natural
Autores
José Ángel González Fraga, UABC
Carlos Eduardo Sánchez Torres, UABC
NLP
![](Untitled%20397.png)
Minería de datos
Minería de datos es encontrar patrones significativos en datos (convertir datos en información) y a predecirlos (aplicar algoritmos de aprendizaje —Aprendizaje automático o Machine Learning).
![](data-mining-what-it-is.jpg)
Relación entre NLP y Machine Learning
Existen otros enfoques que no usan Machine Learning tales como Análisis de reglas gramaticales, búsqueda de palabras clave, sistemas basados en diccionarios y ontologías e ingeniería de características.
![](Untitled%20398.png)
Metodología de un proyecto de Minería de datos
Machine Learning (Aprendizaje automático)
Enfoque tradicional vs enfoque de aprendizaje
![](Untitled%20399.png)
![](Untitled%20400.png)
![](Untitled%20401.png)
https://graph-theory.sanchezcarlosjr.com/
https://rednuht.org/genetic_walkers/
https://rednuht.org/genetic_cars_2/
https://gist.github.com/sanchezcarlosjr/2d017462b549ebe3baf7842cf79d1e33
Aprendizaje supervisado
![](Untitled%20402.png)
Dado un conjunto de entrenamiento con un conjunto de características y un conjunto de variables objetivo , un algoritmo de aprendizaje busca en el espacio de hipótesis una tal que sea un buen predictor para los correspondientes . Nota: Las redes neuronales son algoritmos de aprendizaje supervisados. Tenemos otro conjunto de prueba para comprobar que nuestros resultados no realizen overfitting con las métricas: precision, accuracy, f-score, recall.
https://gist.github.com/sanchezcarlosjr/2d017462b549ebe3baf7842cf79d1e33
CS229: Machine Learning. (2023, May 04). Retrieved from https://cs229.stanford.edu
Ejemplos
https://gist.github.com/sanchezcarlosjr/91c8b8588e339381ae2b75fa868ee7e8
Embeddings
https://projector.tensorflow.org/
Referencias
https://huggingface.co/learn/nlp-course/chapter0/1?fw=tf