Universidad de Jaén

Menú local

Guía docente 2021-22 - 78412010 - Big data e inteligencia artificial

TITULACIÓN: Máster Univ. en Industria conectada
CENTRO: ESCUELA POLITÉCNICA SUPERIOR (LINARES)
CURSO: 2021-22
ASIGNATURA: Big data e inteligencia artificial
GUÍA DOCENTE
1. DATOS BÁSICOS DE LA ASIGNATURA
NOMBRE: Big data e inteligencia artificial
CÓDIGO: 78412010 CURSO ACADÉMICO: 2021-22
TIPO: Obligatoria
Créditos ECTS: 4.0 CURSO: 1 CUATRIMESTRE: SC
WEB: https://platea.ujaen.es
2. DATOS BÁSICOS DEL PROFESORADO
NOMBRE: CANO DE AMO, JOSÉ RAMÓN
IMPARTE: Teoría [Profesor responsable]
DEPARTAMENTO: U118 - INFORMÁTICA
ÁREA: 570 - LENGUAJES Y SISTEMAS INFORMÁTICOS
N. DESPACHO: D - D-150 E-MAIL: jrcano@ujaen.es TLF: 953648585
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/61557
URL WEB: http://wwwdi.ujaen.es/~jrcano/
ORCID: https://orcid.org/0000-0001-9150-4113
 
NOMBRE: GONZÁLEZ GARCÍA, PEDRO
IMPARTE: Teoría
DEPARTAMENTO: U118 - INFORMÁTICA
ÁREA: 570 - LENGUAJES Y SISTEMAS INFORMÁTICOS
N. DESPACHO: - E-MAIL: - TLF: -
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/57923
URL WEB: -
ORCID: https://orcid.org/0000-0002-6733-3868
 
NOMBRE: MUÑOZ EXPÓSITO, JOSÉ ENRIQUE
IMPARTE: Teoría
DEPARTAMENTO: U134 - INGENIERÍA DE TELECOMUNICACIÓN
ÁREA: 560 - INGENIERÍA TELEMÁTICA
N. DESPACHO: D - 135 E-MAIL: jemunoz@ujaen.es TLF: 953648543
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/58226
URL WEB: http://www4.ujaen.es/~jemunoz/
ORCID: https://orcid.org/0000-0002-7483-2964
 
3. PRERREQUISITOS, CONTEXTO Y RECOMENDACIONES
PRERREQUISITOS:
-
CONTEXTO DENTRO DE LA TITULACIÓN:

.

RECOMENDACIONES Y ADAPTACIONES CURRICULARES:
- El alumnado que presente necesidades específicas de apoyo educativo, lo ha de notificar personalmente al Servicio de Atención y Ayudas al Estudiante para proceder a realizar, en su caso, la adaptación curricular correspondiente.
4. COMPETENCIAS Y RESULTADOS DE APRENDIZAJE
código Denominación de la competencia
CB10 Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
CB6 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
CB7 Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
CB8 Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
CB9 Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
CG1MIC Conocer y utilizar las Tecnologías de la Información y la Comunicación aplicadas a la Industria conectada.
CG3MIC Comprender y ser capaz de aplicar herramientas de investigación en el ámbito de la Industria conectada.
CT3 Conocer y aplicar las herramientas para la búsqueda activa de empleo y el desarrollo de proyectos de emprendimiento.
CT4 Desarrollar las aptitudes para el trabajo cooperativo y la participación en equipos, las habilidades de negociación e incorporar los valores de cooperación, esfuerzo, respeto y compromiso con la búsqueda de la calidad como signo de identidad.
CT5 Analizar, razonar críticamente, pensar con creatividad y evaluar el propio proceso de aprendizaje discutiendo asertiva y estructuradamente las ideas propias y ajenas.
E20MIC Conocer y utilizar alguna de las herramientas de Big Data más recientes en el mercado.
E21MIC - Tener conocimiento sobre algoritmos de aprendizaje automático para extraer información de interés de grandes volúmenes de información.
E22MIC Ser capaz de diseñar, crear y determinar los mecanismos necesarios para usar Big Data y extraer conocimiento mediante aprendizaje automático sobre un problema determinado.
 
Resultados de aprendizaje
Resultado RB10 Ser capaces de asumir la responsabilidad de su propio desarrollo profesional y de su especialización en uno o más campos de estudio.
Resultado RB6 . Haber adquirido conocimientos avanzados y demostrado, en un contexto de investigación científica y tecnológica o altamente especializado, una comprensión detallada y fundamentada de los aspectos teóricos y prácticos y de la metodología de trabajo en uno o más campos de estudio.
Resultado RB7 Saber aplicar e integrar sus conocimientos, la comprensión de estos, su fundamentación científica y sus capacidades de resolución de problemas en entornos nuevos y definidos de forma imprecisa, incluyendo contextos de carácter multidisciplinar tanto investigadores como profesionales altamente especializados.
Resultado RB7b Ser capaces de predecir y controlar la evolución de situaciones complejas mediante el desarrollo de nuevas e innovadoras metodologías de tra- bajo adaptadas al ámbito científico/investigador, tecnológico o profesional concreto, en general multidisciplinar, en el que se desarrolle su actividad.
Resultado RB7c Haber desarrollado la autonomía suficiente para participar en proyectos de investigación y colaboraciones científicas o tecnológicas dentro su ámbito temático, en contextos interdisciplinares y, en su caso, con una alta componente de transferencia del conocimiento.
Resultado RB8 Saber evaluar y seleccionar la teoría científica adecuada y la metodología precisa de sus campos de estudio para formular juicios a partir de in- formación incompleta o limitada incluyendo, cuando sea preciso y pertinente, una reflexión sobre la responsabilidad social o ética ligada a la solución que se proponga en cada caso.
Resultado RB9 Saber transmitir de un modo claro y sin ambigüedades a un público especializado o no, resultados procedentes de la investigación científica y tecnológica o del ámbito de la innovación más avanzada, así como los fundamentos más relevantes sobre los que se sustentan.
Resultado RE23MIC Demuestra que es capaz de utilizar alguna de las herramientas de Big Data más recientes en el mercado
Resultado RE24MIC Conoce algoritmos de aprendizaje automático para extraer información de interés de grandes volúmenes de información.
Resultado RE25MIC Es capaz de diseñar, crear y determinar los mecanismos necesarios para usar Big Data y extraer conocimiento mediante aprendizaje automático sobre un problema determinado.
Resultado RG1MIC Demuestra que conoce y utiliza las Tecnologías de la Información y la Comunicación aplicadas a la Industria conectada.
Resultado RG3MIC Demuestra que comprende y utiliza herramientas de investigación en el ámbito de la Industria de conectada.
Resultado RT3 . Conoce y aplica las herramientas para la búsqueda activa de empleo y el desarrollo de proyectos de emprendimiento.
Resultado RT4 Demuestra habilidades para el trabajo cooperativo, la participación en equipos y la negociación, incorporando los valores de cooperación, esfuer- zo, respecto y compromiso con la búsqueda de la calidad como signo de identidad.
Resultado RT5 Analiza y razona críticamente, discutiendo asertiva y estructuradamente las ideas propias y ajenas, demostrando pensamiento creativo y capacidad para evaluar el propio proceso de aprendizaje
5. CONTENIDOS

En esta asignatura el alumno conocerá herramientas de Big Data que podrán ser empleadas junto con técnicas de aprendizaje automático para extraer información útil aplicable a procesos industriales. En el laboratorio se realizarán actividades prácticas sobre cada uno de esos aspectos:

· Introducción a aplicaciones de Big Data.
· Métodos de aprendizaje automático para extracción de información relevante.
· Estudio del empleo de esas técnicas en casos concretos del  ámbito de la ingeniería.

Teoría


Tema 1. Ciencia de Datos, analítica avanzada y big data

o La era de los datos, científico de datos, minería de datos y KDD, aplicaciones
o Interpretabilidad vs. Precisión
o Big Data: las tres 'V'. Presencia en medios e impacto económico
o Casos reales: sistemas de recomendación en Amazon y Netflix, transacciones de tarjetas de crédito, epidemiología, redes sociales
o Software: Weka, KNIME, KEEL, scikit-learn (Python), R...
o Competición Kaggle
o Hacia dónde vamos, errores comunes, tecnología emergente, evolución de popularidad


Tema 2. Preprocesamiento: selección y procesado de instancias y características, tratamiento del ruido

o Importancia del preprocesamiento
o Integración, limpieza, normalización, transformación... 
o Valores perdidos
o Datos con ruido
o Selección de variable e instancias
o Discretización: CAIM


Tema 3. Fundamentos de clasificación: árboles de decisión, lazy, RNA, bayesianos, evaluación

o Definición del problema
o Etapas en el proceso de clasificación
o Clasificadores basados en instancias: lazy learning y vecinos cercanos
o Árboles de decisión e inducción de reglas: ID3 y C4.5
o Redes neuronales: MLP, RBFN
o Métodos bayesianos: Naïve Bayes,
o Evaluación: métricas, métodos, comparación, ROC


Tema 4. Segmentación y relaciones: clustering y reglas de asociación

o Aprendizaje no supervisado
o Clustering: definición, análisis, medidas de distancia y similaridad, métodos de particionamiento, k-means, métodos jerárquicos aglomerativos y divisivos
o Reglas de asociación: market basket analysis, conceptos, asociaciones booleanas y cuantitativas, unidimensionales y multidimensionales, soporte y confianza, algoritmo Apriori, medidas de interés, lift, otros algoritmos (FP-Growth, OPUS, QAR).


Tema 5. Aprendizaje incremental y data stream mining

o Introducción y definición. 
o Minería de flujo de datos.
o Software y plataformas de flujo de datos.



Tema 6. Exploración y visualización de los datos

o Introducción y ejemplos. 
o Tipos de representaciones gráficas. 
o Análisis exploratorio de datos
o Software para visualización de datos.

 

Tema 7. Big data: fundamentos y paradigmas

o Las 3+5 'V' 
o Paradigma MapReduce
o Ecosistema Hadoop, Spark
o Mahout, MLlib, FlinkML, H2O... 
o Big data preprocessing
o Bibliotecas para analítica de datos, casos de estudio
o Aplicaciones reales


Tema 8. Big data e Inteligencia Aritificial: ejemplos en Ingeniería

 

Prácticas:

Entorno KNIME:
o Introducción
o Instalación de KNIME
o Introducción a la interfaz gráfica de KNIME: editor, nodos, manipulación de datos, visualización, etc.
o Creación de un flujo de dato básico (WorkFlow)
o Ejercicios básicos
o Scripting in KNIME
o Validación cruzada
o Preprocesamiento en KNIME: selección de características, normalización, selección de prototipos, discretización, valores perdidos (missing values)
o Técnicas de comparación entre métodos
o Ejercicios avanzados

Desarrollo de un proyecto de Descubrimiento de Información en bases de datos haciendo uso de la plataforma KNIME. El alumno escogerá un problema sobre el que trabajar de entre los ofrecidos y deberá realizar las diferentes tareas del proceso de descubrimiento de conocimiento:
- Preparación de los datos (Práctica 1)
- Extracción de modelos mediante técnicas de minería de datos (Práctica 2)
- Visualización de los resultados (Práctica 3)
- Validación de los modelos (Práctica 4)

6. METODOLOGÍA Y ACTIVIDADES
 
ACTIVIDADES HORAS PRESEN­CIALES HORAS TRABAJO AUTÓ­NOMO TOTAL HORAS CRÉDITOS ECTS COMPETENCIAS (códigos)
A1 - Clases expositivas en gran grupo
  • M2 - Exposición de teoría y ejemplos generales
  • M35 - Clases expositivas: Clases magistrales
  • M4 - Conferencias, seminarios, etc
  • m1 - Clases magistrales
16.0 34.0 50.0 2.0
  • CB10
  • CB6
  • CB8
  • CB9
  • CT5
  • E21MIC -
  • E22MIC
A54 - Actividades prácticas: debates y seminarios
  • M101 - Debates, seminarios, etc
16.0 34.0 50.0 2.0
  • CB7
  • CG1MIC
  • CG3MIC
  • CT3
  • CT4
  • CT5
  • E20MIC
  • E22MIC
TOTALES: 32.0 68.0 100.0 4.0  
 
INFORMACIÓN DETALLADA:


La asignatura se divide en dos partes fuertemente relacionadas: teoría y prácticas.

La teoría se impartirá en su mayor parte con sesiones magistrales, incluyendo varias sesiones de actividades, resolución de dudas, realización de trabajos, y debate con las que se evaluará la participación del alumno en la asignatura.  La teoría evaluará las competencias CB6, CB8,CB9, CB10,  CT5,  E21MIC, E22MIC.

La parte práctica se realizará en el laboratorio de informática, utilizando el ordenador para el desarrollode dichas sesiones. Se evaluará la destreza en la resolución de los programas propuestos. La participación en actividades de prácticas en el laboratorio evaluará las competencias  CB7, CT3, CT4, CT5, CG1MIC, CG3MIC, E20MIC, E22MIC.

El desarrollo de trabajos dirigidos evaluará las competencias CB6, CB7, CB8, CB9, CB10, CG1MIC, CG2MIC, CG3MIC, CT3, CT4, E20MIC, E21MIC, E22MIC. 

 

 

7. SISTEMA DE EVALUACIÓN
 
ASPECTO CRITERIOS INSTRUMENTO PESO
Asistencia y/o participación en actividades presenciales y/o virtuales Asistencia en actividades presenciales y/o virtuales. . 0.0%
Conceptos teóricos de la materia Examen sobre los conceptos teóricos y prácticos de la materia. . 20.0%
Realización de trabajos, casos o ejercicios Realización de trabajos, casos o ejercicios prácticos. . 40.0%
Participación y Actividad en foros virtuales Participación en actividades presenciales y/o virtuales. . 40.0%
El sistema de calificación se regirá por lo establecido en el RD 1125/2003 de 5 de septiembre por el que se establece el sistema europeo de créditos y el sistema de calificaciones en la titulaciones universitarias de carácter oficial
INFORMACIÓN DETALLADA:

Atendiendo a lo recogido en el art. 13 del Reglamento de Régimen Académico y de Evaluación del alumnado de la Universidad de Jaén, la evaluación de la asignatura será global. 

 

Ésta se realizará atendiendo a las actividades descritas en la sección de Metodología y Actividades.

Para aprobar la asignatura, el alumno deberá obtener una calificación igual o superior a 5,0 sobre 10 en el cómputo total de los aspectos evaluados, siempre y cuando éste tenga una calificación igual o superior a 4,0 en cada una de las partes (S2, S3, S8) evaluadas.
Las partes superadas en cada convocatoria se mantendrán hasta final del curso. 


La  EVALUACIÓN  se realizará atendiendo a las siguientes actividades:


o Los conceptos teóricos de la materia: 20%. A lo largo del curso se realizará pruebas de evaluación contínua sobre cuestiones teóricas desarrolladas en las clases expositivas. En este apartado se evaluarán las competencias: CB6, CB8,CB9, CB10,  CT5,  E21MIC, E22MIC. Los resultados de aprendizaje serán RB6, RB7, RB8, RB10, RG1MIC, RG3MIC, RE24MIC. 

 

o Realización de trabajos, casos o ejercicios: 40%. Durante el curso se realizará un trabajo documental sobre aspectos desarrollados en las clases expositivas. En este apartado se evaluarán las competencias: CB6, CB7, CB8, CB9, CB10, CG1MIC, CG2MIC, CG3MIC, CT3, CT4, E20MIC, E21MIC, E22MIC. Los resultados de aprendizaje serán RB6, RB7, RB7b, RB7c, RB8, RB9, RB10, RG1MIC, RG3MIC, RT3,  RT4, RT5, RE24MIC.


o Prácticas de laboratorio/ordenador: 40%. En este apartado se valorará la realización de las prácticas y la entrega de la documentación solicitada. Se evaluarán las competencias: CB7, CT3, CT4, CT5, CG1MIC, CG3MIC, E20MIC, E22MIC.  Los resultados de aprendizaje serán RB6, RB7, RB7b, RB7c, RB9, RB10, RG1MIC, RG3MIC, RT3,  RT4, RT5, RE23MIC, RE25MIC.

 

8. DOCUMENTACIÓN / BIBLIOGRAFÍA
ESPECÍFICA O BÁSICA:
  • Data mining : the textbook. Edición: -. Autor: Aggarwal, Charu C. Editorial: Cham : Springer, 2015  (C. Biblioteca)
  • Introduction to machine learning. Edición: 2nd ed.. Autor: Alpaydin, Ethem.. Editorial: Cambridge, Mass. : MIT Press, 2010  (C. Biblioteca)
  • Artificial intelligence : a modern approach. Edición: 3rd ed. Autor: Russell, Stuart J.. Editorial: Harlow : Pearson Education, 2014  (C. Biblioteca)
  • Big Data in Engineering Applications (Studies in Big Data). Edición: 1st ed. 2018. Autor: Sanjibam. Editorial: Springer  (C. Biblioteca)
GENERAL Y COMPLEMENTARIA:
  • Data mining : practical machine learning tools and techniques. Edición: 4th ed.. Autor: -. Editorial: Amsterdam [etc.] : Elsevier : Morgan Kaufman, cop. 2017  (C. Biblioteca)
  • Big data : técnicas, herramientas y aplicaciones. Edición: -. Autor: Pérez Marqués, María. Editorial: Madrid : RC Libros, 2015  (C. Biblioteca)
  • Inteligencia artificial, inteligencia computaciones y big data. Edición: -. Autor: Herrera Triguero, Francisco. Editorial: Jaén: Universidad de Jaén, Servicio de publicaciones, 2014  (C. Biblioteca)
9. CRONOGRAMA

-  Clase 1: Presentación/Tema 1
-  Clase 2: Tema 1 / P1
-  Clase 3: Tema 2 / P1 
-  Clase 4: Tema 2 / P1 
-  Clase 5: Tema 3 / P2
-  Clase 6: Tema 3 / P2
-  Clase 7: Tema 4 / P2
-  Clase 8 : Tema 4 / P2
-  Clase 9: Tema 5 / P3 
-  Clase 10: Tema 5 / P3
-  Clase 11: Tema 6 / P3 
-  Clase 12: Tema 6 / P3
-  Clase 13: Tema 7 / P4
-  Clase 14: Tema 7 / P4 
-  Clase 15: Tema 8 / P4 
-  Clase 16: Tema 8 / P4 

10. ESCENARIO MULTIMODAL O MIXTO

Las actividades que no puedan realizarse de forma presencial se desarrollarán en formato semipresencial con asistencia rotatoria, y utilización de sistemas de videoconferencia, siempre que el aforo y la infraestructura del espacio asignado para la docencia de la asignatura lo permitan. 

Queda expresamente prohibida la grabación por ningún medio de las actividades presenciales o no presenciales síncronas.

11. ESCENARIO NO PRESENCIAL

Las actividades que no puedan realizarse de forma presencial se realizarán mediante actividades síncronas y/o asíncronas realizadas mediante la plataforma de docencia virtual.

Queda expresamente prohibida la grabación por ningún medio de las actividades presenciales o no presenciales síncronas.

El sistema e instrumentos de evaluación serán los mismos que para la modalidad presencial, sustituyendo las pruebas presenciales por pruebas similares desarrolladas mediante el uso de la plataforma de docencia online, siempre que se garantice la identidad del estudiante.

CLÁUSULA DE PROTECCIÓN DE DATOS (evaluación on-line)

Responsable del tratamiento: Universidad de Jaén, Campus Las Lagunillas, s/n, 23071 Jaén

Delegado de Protección de Datos:dpo@ujaen.es

Finalidad: Conforme a la Ley de Universidades y demás legislación estatal y autonómica vigente, realizar los exámenes correspondientes a las asignaturas en las que el alumno o alumna se encuentre matriculado. Con el fin de evitar fraudes en la realización del mismo, el examen se realizará en la modalidad de video llamada, pudiendo el personal de la Universidad de Jaén contrastar la imagen de la persona que está realizando la prueba de evaluación con los archivos fotográficos del alumno en el momento de la matrícula. Igualmente, con la finalidad de dotar a la prueba de evaluación de contenido probatorio de cara a revisiones o impugnaciones de la misma, de acuerdo con la normativa vigente, la prueba de evaluación será grabada.

Legitimación: cumplimiento de obligaciones legales (Ley de Universidades) y demás normativa estatal y autonómica vigente.

Destinatarios: prestadores de servicios titulares de las plataformas en las que se realicen las pruebas con los que la Universidad de Jaén tiene suscritos los correspondientes contratos de acceso a datos.

Plazos de conservación: los establecidos en la normativa aplicable. En el supuesto en concreto de las grabaciones de los exámenes, mientras no estén cerradas las actas definitivas y la prueba de evaluación pueda ser revisada o impugnada.

Derechos: puede ejercitar sus derechos de acceso, rectificación, cancelación, oposición, supresión, limitación y portabilidad remitiendo un escrito a la dirección postal o electrónica indicada anteriormente. En el supuesto que considere que sus derechos han sido vulnerados, puede presentar una reclamación ante el Consejo de Transparencia y Protección de Datos de Andalucía www.ctpdandalucia.es

Cláusula grabación de clases PROTECCIÓN DE DATOS DE CARÁCTER PERSONAL

Responsable del tratamiento: Universidad de Jaén, Paraje Las Lagunillas, s/n; Tel.953 212121; www.ujaen.es

Delegado de Protección de Datos (DPO): TELEFÓNICA, S.A.U. ; Email: dpo@ujaen.es

Finalidad del tratamiento: Gestionar la adecuada grabación de las sesiones docentes con el objetivo de hacer posible la enseñanza en un escenario de docencia multimodal y/o no presencial.

Plazo de conservación: Las imágenes serán conservadas durante los plazos legalmente previstos en la normativa vigente.

Legitimación: Los datos son tratados en base al cumplimiento de obligaciones legales (Ley Orgánica 6/2001, de 21 de diciembre, de Universidades) y el consentimiento otorgado mediante la marcación de la casilla habilitada a tal efecto.

Destinatarios de los datos (cesiones o transferencias): Toda aquella persona que vaya a acceder a las diferentes modalidades de enseñanza.

Derechos: Ud. podrá ejercitar los derechos de Acceso, Rectificación, Cancelación, Portabilidad, Limitación del tratamiento, Supresión o, en su caso, Oposición. Para ejercitar los derechos deberá presentar un escrito en la dirección arriba señalada dirigido al Servicio de Información, Registro y Administración Electrónica de la Universidad de Jaén, o bien, mediante correo electrónico a la dirección de correo electrónico. Deberá especificar cuál de estos derechos solicita sea satisfecho y, a su vez, deberá acompañarse de la fotocopia del DNI o documento identificativo equivalente. En caso de que actuara mediante representante, legal o voluntario, deberá aportar también documento que acredite la representación y documento identificativo del mismo. Asimismo, en caso de considerar vulnerado su derecho a la protección de datos personales, podrá interponer una reclamación ante el Consejo de Transparencia y Protección de Datos de Andalucía www.ctpdandalucia.es