Data mining y machine learning

DATOS GENERALES

Código ISID723
Pensum 2020
Horas semanales 9
Tipo Obligatoria
Asignaturas pre-requisitos ISWD453 - Bases de datos distribuidas
Asignaturas co-requisitos Ninguna
Campo de formación
Unidad de organización curricular Unidad Profesional

RESULTADOS DE APRENDIZAJE

De conocimiento
Estudiar y analizar los fundamentos, enfoques y algoritmos de machine learning y data mining
De destrezas Diseñar e implementar soluciones basadas en algoritmos de machine learning para la extracción de información, análisis, visualización y construcción de modelos de predicción a partir de datos 
De valores y actitudes Abstraer problemas y desarrollar soluciones con responsabilidad y ética profesional

CONTENIDO

Capítulo 1 Fundamentos de Machine Learning
  1. Introducción al problema de aprendizaje: planteamiento del problema y ejemplos;
  2. Problemas de machine learning: clasificación, regresión y clustering;
  3. Conjuntos de entrenamiento, validación y testeo, y
  4. Overfitting, underfitting y maldición de la dimensión.
Capítulo 2 Aprendizaje supervisado
  1. Estimación de error y análisis de resultados: hold-out, cross-validation, matriz de confusión y curva ROC;
  2. Algoritmos no paramétricos: Naïve Bayes, k-nearest neighbors (kNN) y árboles de decisión;
  3. Algoritmos paramétricos: regresión lineal, regresión logística y clasificador sofmax;
  4. Algoritmos paramétricos: redes neuronales artificiales;
  5. Algoritmos paramétricos: support vector machines (SVM), y
  6. Introducción a deep learning: convolutional neural networks (CNN) y autoencoders.
Capítulo 3 Aprendizaje no supervisado
  1. Métricas para análisis de resultados de clustering;
  2. Algoritmos para reducción de dimensión: PCA y tSNE;
  3. Clustering: k-means, y
  4. Clustering: Self-organizing maps.
Capítulo 4 Aprendizaje por refuerzo
  1. Procesos de decisión Markovianos;
  2. Exploración vs. Explotación, y
  3. Algoritmos de aprendizaje por refuerzo.
Capítulo 5 Data Mining
  1. Introducción y ejemplos de minería de datos;
  2. Patrones asociativos y sequenciales;
  3. Market basket analysis;
  4. Preprocesamiento de datos;
  5. Visualización de datos, y
  6. Sistemas de recomendación.

Back to top