Universidad de Jaén

Menú local

Guía docente 2018-19 - 78412010 - Big data e inteligencia artificial

TITULACIÓN: Máster Univ. en Industria conectada
CENTRO: Centro de Estudios de Postgrado de UJA

CURSO ACADÉMICO: 2018-19
GUÍA DOCENTE
1. DATOS BÁSICOS DE LA ASIGNATURA
NOMBRE: Big data e inteligencia artificial
CÓDIGO: 78412010 CURSO ACADÉMICO: 2018-19
TIPO: Obligatoria
Créditos ECTS: 4.0 CURSO: 1 CUATRIMESTRE: SC
WEB: https://dv.ujaen.es/docencia/goto_docencia_crs_898262.html
 
2. DATOS BÁSICOS DEL PROFESORADO
NOMBRE: CANO DE AMO, JOSÉ RAMÓN
IMPARTE: Teoría [Profesor responsable]
DEPARTAMENTO: U118 - INFORMÁTICA
ÁREA: 570 - LENGUAJES Y SISTEMAS INFORMÁTICOS
N. DESPACHO: - E-MAIL: - TLF: -
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/61557
URL WEB: -
 
NOMBRE: GONZÁLEZ GARCÍA, PEDRO
IMPARTE: Teoría
DEPARTAMENTO: U118 - INFORMÁTICA
ÁREA: 570 - LENGUAJES Y SISTEMAS INFORMÁTICOS
N. DESPACHO: A3 - 123 E-MAIL: pglez@ujaen.es TLF: 953212464
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/57923
URL WEB: http://www4.ujaen.es/~pglez
 
NOMBRE: MUÑOZ EXPÓSITO, JOSÉ ENRIQUE
IMPARTE: Teoría
DEPARTAMENTO: U134 - INGENIERÍA DE TELECOMUNICACIÓN
ÁREA: 560 - INGENIERÍA TELEMÁTICA
N. DESPACHO: - E-MAIL: - TLF: -
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/58226
URL WEB: -
 
3. PRERREQUISITOS, CONTEXTO Y RECOMENDACIONES
PRERREQUISITOS:
-
CONTEXTO DENTRO DE LA TITULACIÓN:

.

RECOMENDACIONES Y ADAPTACIONES CURRICULARES:
-
El alumnado que presente necesidades específicas de apoyo educativo, lo ha de notificar personalmente al Servicio de Atención y Ayudas al Estudiante para proceder a realizar, en su caso, la adaptación curricular correspondiente.
4. COMPETENCIAS Y RESULTADOS DE APRENDIZAJE
código Denominación de la competencia
CB10 Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
CB6 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
CB7 Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
CB8 Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
CB9 Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
CG1MIC Conocer y utilizar las Tecnologías de la Información y la Comunicación aplicadas a la Industria conectada.
CG3MIC Comprender y ser capaz de aplicar herramientas de investigación en el ámbito de la Industria conectada.
CT3 Conocer y aplicar las herramientas para la búsqueda activa de empleo y el desarrollo de proyectos de emprendimiento.
CT4 Desarrollar las aptitudes para el trabajo cooperativo y la participación en equipos, las habilidades de negociación e incorporar los valores de cooperación, esfuerzo, respeto y compromiso con la búsqueda de la calidad como signo de identidad.
CT5 Analizar, razonar críticamente, pensar con creatividad y evaluar el propio proceso de aprendizaje discutiendo asertiva y estructuradamente las ideas propias y ajenas.
E20MIC Conocer y utilizar alguna de las herramientas de Big Data más recientes en el mercado.
E21MIC - Tener conocimiento sobre algoritmos de aprendizaje automático para extraer información de interés de grandes volúmenes de información.
E22MIC Ser capaz de diseñar, crear y determinar los mecanismos necesarios para usar Big Data y extraer conocimiento mediante aprendizaje automático sobre un problema determinado.
Resultados de aprendizaje
Resultado RB10 Ser capaces de asumir la responsabilidad de su propio desarrollo profesional y de su especialización en uno o más campos de estudio.
Resultado RB6 . Haber adquirido conocimientos avanzados y demostrado, en un contexto de investigación científica y tecnológica o altamente especializado, una comprensión detallada y fundamentada de los aspectos teóricos y prácticos y de la metodología de trabajo en uno o más campos de estudio.
Resultado RB7 Saber aplicar e integrar sus conocimientos, la comprensión de estos, su fundamentación científica y sus capacidades de resolución de problemas en entornos nuevos y definidos de forma imprecisa, incluyendo contextos de carácter multidisciplinar tanto investigadores como profesionales altamente especializados.
Resultado RB7b Ser capaces de predecir y controlar la evolución de situaciones complejas mediante el desarrollo de nuevas e innovadoras metodologías de tra- bajo adaptadas al ámbito científico/investigador, tecnológico o profesional concreto, en general multidisciplinar, en el que se desarrolle su actividad.
Resultado RB7c Haber desarrollado la autonomía suficiente para participar en proyectos de investigación y colaboraciones científicas o tecnológicas dentro su ámbito temático, en contextos interdisciplinares y, en su caso, con una alta componente de transferencia del conocimiento.
Resultado RB8 Saber evaluar y seleccionar la teoría científica adecuada y la metodología precisa de sus campos de estudio para formular juicios a partir de in- formación incompleta o limitada incluyendo, cuando sea preciso y pertinente, una reflexión sobre la responsabilidad social o ética ligada a la solución que se proponga en cada caso.
Resultado RB9 Saber transmitir de un modo claro y sin ambigüedades a un público especializado o no, resultados procedentes de la investigación científica y tecnológica o del ámbito de la innovación más avanzada, así como los fundamentos más relevantes sobre los que se sustentan.
Resultado RE23MIC Demuestra que es capaz de utilizar alguna de las herramientas de Big Data más recientes en el mercado
Resultado RE24MIC Conoce algoritmos de aprendizaje automático para extraer información de interés de grandes volúmenes de información.
Resultado RE25MIC Es capaz de diseñar, crear y determinar los mecanismos necesarios para usar Big Data y extraer conocimiento mediante aprendizaje automático sobre un problema determinado.
Resultado RG1MIC Demuestra que conoce y utiliza las Tecnologías de la Información y la Comunicación aplicadas a la Industria conectada.
Resultado RG3MIC Demuestra que comprende y utiliza herramientas de investigación en el ámbito de la Industria de conectada.
Resultado RT3 . Conoce y aplica las herramientas para la búsqueda activa de empleo y el desarrollo de proyectos de emprendimiento.
Resultado RT4 Demuestra habilidades para el trabajo cooperativo, la participación en equipos y la negociación, incorporando los valores de cooperación, esfuer- zo, respecto y compromiso con la búsqueda de la calidad como signo de identidad.
Resultado RT5 Analiza y razona críticamente, discutiendo asertiva y estructuradamente las ideas propias y ajenas, demostrando pensamiento creativo y capacidad para evaluar el propio proceso de aprendizaje
5. CONTENIDOS

En esta asignatura el alumno conocerá herramientas de Big Data que podrán ser empleadas junto con técnicas de aprendizaje automático para extraer información útil aplicable a procesos industriales. En el laboratorio se realizarán actividades prácticas sobre cada uno de esos aspectos:

· Introducción a aplicaciones de Big Data.
· Métodos de aprendizaje automático para extracción de información relevante.
· Estudio del empleo de esas técnicas en casos concretos del  ámbito de la ingeniería.

Teoría


Tema 1. Ciencia de Datos, analítica avanzada y big data

o La era de los datos, científico de datos, minería de datos y KDD, aplicaciones
o Interpretabilidad vs. Precisión
o Big Data: las tres 'V'. Presencia en medios e impacto económico
o Casos reales: sistemas de recomendación en Amazon y Netflix, transacciones de tarjetas de crédito, epidemiología, redes sociales
o Software: Weka, KNIME, KEEL, scikit-learn (Python), R...
o Competición Kaggle
o Hacia dónde vamos, errores comunes, tecnología emergente, evolución de popularidad


Tema 2. Preprocesamiento: selección y procesado de instancias y características, tratamiento del ruido

o Importancia del preprocesamiento
o Integración, limpieza, normalización, transformación... 
o Valores perdidos
o Datos con ruido
o Selección de variable e instancias
o Discretización: CAIM


Tema 3. Fundamentos de clasificación: árboles de decisión, lazy, RNA, bayesianos, evaluación

o Definición del problema
o Etapas en el proceso de clasificación
o Clasificadores basados en instancias: lazy learning y vecinos cercanos
o Árboles de decisión e inducción de reglas: ID3 y C4.5
o Redes neuronales: MLP, RBFN
o Métodos bayesianos: Naïve Bayes,
o Evaluación: métricas, métodos, comparación, ROC


Tema 4. Segmentación y relaciones: clustering y reglas de asociación

o Aprendizaje no supervisado
o Clustering: definición, análisis, medidas de distancia y similaridad, métodos de particionamiento, k-means, métodos jerárquicos aglomerativos y divisivos
o Reglas de asociación: market basket analysis, conceptos, asociaciones booleanas y cuantitativas, unidimensionales y multidimensionales, soporte y confianza, algoritmo Apriori, medidas de interés, lift, otros algoritmos (FP-Growth, OPUS, QAR).


Tema 5. Aprendizaje incremental y data stream mining

o Problemas incrementales, aprendizaje dinámico, incremental vs. flujo de datos
o Aprendizaje incremental: concepto, criterios de evaluación, modos de aprendizaje incremental de ejemplos, clases y atributos, aplicabilidad, construcción incremental de árboles de decisión, árboles Hoeffding, VFDT, clustering incremental, STREAM
o Minería de flujo de datos: definición, tareas de clasificación, agrupamiento y patrones frecuentes, concept drift, clasificación, CVFDT, ventana deslizante y factor de decaimiento, ADWIN, ensemble learning para data stream, detección de concept drift, clustering con cambio de concepto, CluStream, patrones frecuentes, heavy hitters, association stream mining, ejemplos reales, líneas abiertas
o Software: RapidMiner, MOA, Sofia-ML, Flink, streamDM...



Tema 6. Análisis exploratorio de datos: visualización

o Motivación, ejemplos de visualización de datos
o Tipos de datos
o Visualizaciones en datos categóricos, temporales, espaciales, multivariable, distribuciones...
o Software: Tableau, QlikView, R, JavaScript...

 

Tema 7. Big data: fundamentos y paradigmas

o Las 3+5 'V' 
o Paradigma MapReduce
o Ecosistema Hadoop, Spark
o Mahout, MLlib, FlinkML, H2O... 
o Big data preprocessing
o Bibliotecas para analítica de datos, casos de estudio
o Aplicaciones reales


Tema 8. Big data e Inteligencia Aritificial: ejemplos en Ingeniería

 

Prácticas:

Entorno KNIME:
o Introducción
o Instalación de KNIME
o Introducción a la interfaz gráfica de KNIME: editor, nodos, manipulación de datos, visualización, etc.
o Creación de un flujo de dato básico (WorkFlow)
o Ejercicios básicos
o Scripting in KNIME
o Validación cruzada
o Preprocesamiento en KNIME: selección de características, normalización, selección de prototipos, discretización, valores perdidos (missing values)
o Técnicas de comparación entre métodos
o Ejercicios avanzados

Desarrollo de un proyecto de Descubrimiento de Información en bases de datos haciendo uso de la plataforma KNIME. El alumno escogerá un problema sobre el que trabajar de entre los ofrecidos y deberá realizar las diferentes tareas del proceso de descubrimiento de conocimiento:
- Preparación de los datos (Práctica 1)
- Extracción de modelos mediante técnicas de minería de datos (Práctica 2)
- Visualización de los resultados (Práctica 3)
- Validación de los modelos (Práctica 4)

6. METODOLOGÍA Y ACTIVIDADES
ACTIVIDADES HORAS PRESEN­CIALES HORAS TRABAJO AUTÓ­NOMO TOTAL HORAS CRÉDITOS ECTS COMPETENCIAS (códigos)
A1 - Clases expositivas en gran grupo
  • M2 - Exposición de teoría y ejemplos generales
  • M35 - Clases expositivas: Clases magistrales
  • M4 - Conferencias, seminarios, etc
  • m1 - Clases magistrales
16.0 34.0 50.0 2.0
  • CB10
  • CB6
  • CB8
  • CB9
  • CT5
  • E21MIC -
  • E22MIC
A54 - Actividades prácticas: debates y seminarios
  • M101 - Debates, seminarios, etc
16.0 34.0 50.0 2.0
  • CB7
  • CG1MIC
  • CG3MIC
  • CT3
  • CT4
  • CT5
  • E20MIC
  • E22MIC
TOTALES: 32.0 68.0 100.0 4.0  
 
INFORMACIÓN DETALLADA:


La asignatura se divide en dos partes fuertemente relacionadas: teoría y prácticas.

La teoría se impartirá en su mayor parte con sesiones magistrales, incluyendo varias sesiones de actividades, resolución de dudas, realización de trabajos, y debate con las que se evaluará la participación del alumno en la asignatura.  La teoría evaluará las competencias CB6, CB8,CB9, CB10,  CT5,  E21MIC, E22MIC.

La parte práctica se realizará en el laboratorio de informática, utilizando el ordenador para el desarrollode dichas sesiones. Se evaluará la destreza en la resolución de los programas propuestos. La participación en actividades de prácticas en el laboratorio evaluará las competencias  CB7, CT3, CT4, CT5, CG1MIC, CG3MIC, E20MIC, E22MIC.

El desarrollo de trabajos dirigidos evaluará las competencias CB6, CB7, CB8, CB9, CB10, CG1MIC, CG2MIC, CG3MIC, CT3, CT4, E20MIC, E21MIC, E22MIC. 

 

 

7. SISTEMA DE EVALUACIÓN
 
ASPECTO CRITERIOS INSTRUMENTO PESO
Asistencia y/o participación en actividades presenciales y/o virtuales Asistencia en actividades presenciales y/o virtuales. . 0.0%
Conceptos teóricos de la materia Examen sobre los conceptos teóricos y prácticos de la materia. . 20.0%
Realización de trabajos, casos o ejercicios Realización de trabajos, casos o ejercicios prácticos. . 40.0%
Participación y Actividad en foros virtuales Participación en actividades presenciales y/o virtuales. . 40.0%
El sistema de calificación se regirá por lo establecido en el RD 1125/2003 de 5 de septiembre por el que se establece el sistema europeo de créditos y el sistema de calificaciones en la titulaciones universitarias de carácter oficial
INFORMACIÓN DETALLADA:

Atendiendo a lo recogido en el art. 13 del Reglamento de Régimen Académico y de Evaluación del alumnado de la Universidad de Jaén, la evaluación de la asignatura será global. 

 

Ésta se realizará atendiendo a las actividades descritas en la sección de Metodología y Actividades.

Para aprobar la asignatura, el alumno deberá obtener una calificación igual o superior a 5,0 sobre 10 en el cómputo total de los aspectos evaluados, siempre y cuando éste tenga una calificación igual o superior a 4,0 en cada una de las partes (S2, S3, S8) evaluadas.
Las partes superadas en cada convocatoria se mantendrán hasta final del curso. 


La  EVALUACIÓN  se realizará atendiendo a las siguientes actividades:


o Los conceptos teóricos de la materia: 20%. A lo largo del curso se realizará pruebas de evaluación contínua sobre cuestiones teóricas desarrolladas en las clases expositivas. En este apartado se evaluarán las competencias: CB6, CB8,CB9, CB10,  CT5,  E21MIC, E22MIC. Los resultados de aprendizaje serán RB6, RB7, RB8, RB10, RG1MIC, RG3MIC, RE24MIC. 

 

o Realización de trabajos, casos o ejercicios: 40%. Durante el curso se realizará un trabajo documental sobre aspectos desarrollados en las clases expositivas. En este apartado se evaluarán las competencias: CB6, CB7, CB8, CB9, CB10, CG1MIC, CG2MIC, CG3MIC, CT3, CT4, E20MIC, E21MIC, E22MIC. Los resultados de aprendizaje serán RB6, RB7, RB7b, RB7c, RB8, RB9, RB10, RG1MIC, RG3MIC, RT3,  RT4, RT5, RE24MIC.


o Prácticas de laboratorio/ordenador: 40%. En este apartado se valorará la realización de las prácticas y la entrega de la documentación solicitada. Se evaluarán las competencias: CB7, CT3, CT4, CT5, CG1MIC, CG3MIC, E20MIC, E22MIC.  Los resultados de aprendizaje serán RB6, RB7, RB7b, RB7c, RB9, RB10, RG1MIC, RG3MIC, RT3,  RT4, RT5, RE23MIC, RE25MIC.

 

8. DOCUMENTACIÓN / BIBLIOGRAFÍA
ESPECÍFICA O BÁSICA:
  • Data mining : the textbook. Edición: -. Autor: Aggarwal, Charu C. Editorial: Cham : Springer, 2015  (C. Biblioteca)
  • Introduction to machine learning. Edición: 2nd ed.. Autor: Alpaydin, Ethem.. Editorial: Cambridge, Mass. : MIT Press, 2010  (C. Biblioteca)
  • Artificial intelligence : a modern approach. Edición: 3rd ed. Autor: Russell, Stuart J.. Editorial: Harlow : Pearson Education, 2014  (C. Biblioteca)
  • Big Data in Engineering Applications (Studies in Big Data). Edición: 1st ed. 2018. Autor: Sanjibam. Editorial: Springer  (C. Biblioteca)
GENERAL Y COMPLEMENTARIA:
  • Data mining : practical machine learning tools and techniques. Edición: 4th ed.. Autor: -. Editorial: Amsterdam [etc.] : Elsevier : Morgan Kaufman, cop. 2017  (C. Biblioteca)
  • Big data : técnicas, herramientas y aplicaciones. Edición: -. Autor: Pérez Marqués, María. Editorial: Madrid : RC Libros, 2015  (C. Biblioteca)
  • Inteligencia artificial, inteligencia computaciones y big data. Edición: -. Autor: Herrera Triguero, Francisco. Editorial: Jaén: Universidad de Jaén, Servicio de publicaciones, 2014  (C. Biblioteca)
9. CRONOGRAMA

- 28 Marzo Jueves: Presentación/Tema 1
- 29 Marzo Viernes: Tema 1 / P1
- 2 Abril Martes: Tema 2 / P1 
- 3 Abril Miércoles: Tema 2 / P1 
- 4 Abril Jueves: Tema 3 / P2
- 5 Abril viernes: Tema 3 / P2
- 9 Abril Martes: Tema 4 / P2
- 10 Abril Miércoles: Tema 4 / P2
- 11 Abril Jueves: Tema 5 / P3 
- 12 Abril Viernes: Tema 5 / P3
- 23 Abril Martes: Tema 6 / P3 
- 24 Abril Miércoles: Tema 6 / P3
- 25 Abril Jueves: Tema 7 / P4
- 26 Abril Viernes: Tema 7 / P4 
- 29 Abril Lunes: Tema 8 / P4 
- 30 Abril Martes: Tema 8 / P4