Menú local
Guía docente 2019-20 - 78412010 - Big data e inteligencia artificial
TITULACIÓN: | Máster Univ. en Industria conectada |
CENTRO: | ESCUELA POLITÉCNICA SUPERIOR (LINARES) |
CURSO: | 2019-20 |
ASIGNATURA: | Big data e inteligencia artificial |
NOMBRE: Big data e inteligencia artificial | |||||
CÓDIGO: 78412010 | CURSO ACADÉMICO: 2019-20 | ||||
TIPO: Obligatoria | |||||
Créditos ECTS: 4.0 | CURSO: 1 | CUATRIMESTRE: SC | |||
WEB: https://dv.ujaen.es/docencia/goto_docencia_crs_898262.html |
NOMBRE: CANO DE AMO, JOSÉ RAMÓN | ||
IMPARTE: Teoría [Profesor responsable] | ||
DEPARTAMENTO: U118 - INFORMÁTICA | ||
ÁREA: 570 - LENGUAJES Y SISTEMAS INFORMÁTICOS | ||
N. DESPACHO: D - D-150 | E-MAIL: jrcano@ujaen.es | TLF: 953648585 |
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/61557 | ||
URL WEB: http://wwwdi.ujaen.es/~jrcano/ | ||
ORCID: https://orcid.org/0000-0001-9150-4113 | ||
NOMBRE: GONZÁLEZ GARCÍA, PEDRO | ||
IMPARTE: Teoría | ||
DEPARTAMENTO: U118 - INFORMÁTICA | ||
ÁREA: 570 - LENGUAJES Y SISTEMAS INFORMÁTICOS | ||
N. DESPACHO: - | E-MAIL: - | TLF: - |
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/57923 | ||
URL WEB: - | ||
ORCID: https://orcid.org/0000-0002-6733-3868 | ||
NOMBRE: MUÑOZ EXPÓSITO, JOSÉ ENRIQUE | ||
IMPARTE: Teoría | ||
DEPARTAMENTO: U134 - INGENIERÍA DE TELECOMUNICACIÓN | ||
ÁREA: 560 - INGENIERÍA TELEMÁTICA | ||
N. DESPACHO: D - 135 | E-MAIL: jemunoz@ujaen.es | TLF: 953648543 |
TUTORÍAS: https://uvirtual.ujaen.es/pub/es/informacionacademica/tutorias/p/58226 | ||
URL WEB: http://www4.ujaen.es/~jemunoz/ | ||
ORCID: https://orcid.org/0000-0002-7483-2964 | ||
.
código | Denominación de la competencia |
CB10 | Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. |
CB6 | Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación |
CB7 | Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio. |
CB8 | Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios. |
CB9 | Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades. |
CG1MIC | Conocer y utilizar las Tecnologías de la Información y la Comunicación aplicadas a la Industria conectada. |
CG3MIC | Comprender y ser capaz de aplicar herramientas de investigación en el ámbito de la Industria conectada. |
CT3 | Conocer y aplicar las herramientas para la búsqueda activa de empleo y el desarrollo de proyectos de emprendimiento. |
CT4 | Desarrollar las aptitudes para el trabajo cooperativo y la participación en equipos, las habilidades de negociación e incorporar los valores de cooperación, esfuerzo, respeto y compromiso con la búsqueda de la calidad como signo de identidad. |
CT5 | Analizar, razonar críticamente, pensar con creatividad y evaluar el propio proceso de aprendizaje discutiendo asertiva y estructuradamente las ideas propias y ajenas. |
E20MIC | Conocer y utilizar alguna de las herramientas de Big Data más recientes en el mercado. |
E21MIC - | Tener conocimiento sobre algoritmos de aprendizaje automático para extraer información de interés de grandes volúmenes de información. |
E22MIC | Ser capaz de diseñar, crear y determinar los mecanismos necesarios para usar Big Data y extraer conocimiento mediante aprendizaje automático sobre un problema determinado. |
Resultados de aprendizaje | |
Resultado RB10 | Ser capaces de asumir la responsabilidad de su propio desarrollo profesional y de su especialización en uno o más campos de estudio. |
Resultado RB6 | . Haber adquirido conocimientos avanzados y demostrado, en un contexto de investigación científica y tecnológica o altamente especializado, una comprensión detallada y fundamentada de los aspectos teóricos y prácticos y de la metodología de trabajo en uno o más campos de estudio. |
Resultado RB7 | Saber aplicar e integrar sus conocimientos, la comprensión de estos, su fundamentación científica y sus capacidades de resolución de problemas en entornos nuevos y definidos de forma imprecisa, incluyendo contextos de carácter multidisciplinar tanto investigadores como profesionales altamente especializados. |
Resultado RB7b | Ser capaces de predecir y controlar la evolución de situaciones complejas mediante el desarrollo de nuevas e innovadoras metodologías de tra- bajo adaptadas al ámbito científico/investigador, tecnológico o profesional concreto, en general multidisciplinar, en el que se desarrolle su actividad. |
Resultado RB7c | Haber desarrollado la autonomía suficiente para participar en proyectos de investigación y colaboraciones científicas o tecnológicas dentro su ámbito temático, en contextos interdisciplinares y, en su caso, con una alta componente de transferencia del conocimiento. |
Resultado RB8 | Saber evaluar y seleccionar la teoría científica adecuada y la metodología precisa de sus campos de estudio para formular juicios a partir de in- formación incompleta o limitada incluyendo, cuando sea preciso y pertinente, una reflexión sobre la responsabilidad social o ética ligada a la solución que se proponga en cada caso. |
Resultado RB9 | Saber transmitir de un modo claro y sin ambigüedades a un público especializado o no, resultados procedentes de la investigación científica y tecnológica o del ámbito de la innovación más avanzada, así como los fundamentos más relevantes sobre los que se sustentan. |
Resultado RE23MIC | Demuestra que es capaz de utilizar alguna de las herramientas de Big Data más recientes en el mercado |
Resultado RE24MIC | Conoce algoritmos de aprendizaje automático para extraer información de interés de grandes volúmenes de información. |
Resultado RE25MIC | Es capaz de diseñar, crear y determinar los mecanismos necesarios para usar Big Data y extraer conocimiento mediante aprendizaje automático sobre un problema determinado. |
Resultado RG1MIC | Demuestra que conoce y utiliza las Tecnologías de la Información y la Comunicación aplicadas a la Industria conectada. |
Resultado RG3MIC | Demuestra que comprende y utiliza herramientas de investigación en el ámbito de la Industria de conectada. |
Resultado RT3 | . Conoce y aplica las herramientas para la búsqueda activa de empleo y el desarrollo de proyectos de emprendimiento. |
Resultado RT4 | Demuestra habilidades para el trabajo cooperativo, la participación en equipos y la negociación, incorporando los valores de cooperación, esfuer- zo, respecto y compromiso con la búsqueda de la calidad como signo de identidad. |
Resultado RT5 | Analiza y razona críticamente, discutiendo asertiva y estructuradamente las ideas propias y ajenas, demostrando pensamiento creativo y capacidad para evaluar el propio proceso de aprendizaje |
En esta asignatura el alumno conocerá herramientas de Big Data que podrán ser empleadas junto con técnicas de aprendizaje automático para extraer información útil aplicable a procesos industriales. En el laboratorio se realizarán actividades prácticas sobre cada uno de esos aspectos:
· Introducción a
aplicaciones de Big Data.
· Métodos de aprendizaje automático para
extracción de información relevante.
· Estudio del empleo de esas técnicas en casos
concretos del ámbito de la ingeniería.
Teoría
Tema 1. Ciencia de Datos, analítica avanzada y big
data
o La era de los datos, científico de datos,
minería de datos y KDD, aplicaciones
o Interpretabilidad vs. Precisión
o Big Data: las tres 'V'. Presencia en medios e impacto
económico
o Casos reales: sistemas de recomendación en Amazon y
Netflix, transacciones de tarjetas de crédito,
epidemiología, redes sociales
o Software: Weka, KNIME, KEEL, scikit-learn (Python), R...
o Competición Kaggle
o Hacia dónde vamos, errores comunes,
tecnología emergente, evolución de popularidad
Tema 2. Preprocesamiento: selección y procesado de
instancias y características, tratamiento del ruido
o Importancia del preprocesamiento
o Integración, limpieza, normalización,
transformación...
o Valores perdidos
o Datos con ruido
o Selección de variable e instancias
o Discretización: CAIM
Tema 3. Fundamentos de clasificación: árboles
de decisión, lazy, RNA, bayesianos, evaluación
o Definición del problema
o Etapas en el proceso de clasificación
o Clasificadores basados en instancias: lazy learning y
vecinos cercanos
o Árboles de decisión e inducción de
reglas: ID3 y C4.5
o Redes neuronales: MLP, RBFN
o Métodos bayesianos: Naïve Bayes,
o Evaluación: métricas, métodos,
comparación, ROC
Tema 4. Segmentación y relaciones: clustering y reglas
de asociación
o Aprendizaje no supervisado
o Clustering: definición, análisis, medidas de
distancia y similaridad, métodos de particionamiento,
k-means, métodos jerárquicos aglomerativos y
divisivos
o Reglas de asociación: market basket analysis,
conceptos, asociaciones booleanas y cuantitativas, unidimensionales
y multidimensionales, soporte y confianza, algoritmo Apriori,
medidas de interés, lift, otros algoritmos (FP-Growth, OPUS,
QAR).
Tema 5. Aprendizaje incremental y data stream mining
o Introducción y definición.
o Minería de flujo de datos.
o Software y plataformas de flujo de datos.
Tema 6. Exploración y visualización de los
datos
o Introducción y ejemplos.
o Tipos de representaciones gráficas.
o Análisis exploratorio de datos
o Software para visualización de datos.
Tema 7. Big data: fundamentos y paradigmas
o Las 3+5 'V'
o Paradigma MapReduce
o Ecosistema Hadoop, Spark
o Mahout, MLlib, FlinkML, H2O...
o Big data preprocessing
o Bibliotecas para analítica de datos, casos de
estudio
o Aplicaciones reales
Tema 8. Big data e Inteligencia Aritificial: ejemplos en
Ingeniería
Prácticas:
Entorno KNIME:
o Introducción
o Instalación de KNIME
o Introducción a la interfaz gráfica de KNIME:
editor, nodos, manipulación de datos, visualización,
etc.
o Creación de un flujo de dato básico
(WorkFlow)
o Ejercicios básicos
o Scripting in KNIME
o Validación cruzada
o Preprocesamiento en KNIME: selección de
características, normalización, selección de
prototipos, discretización, valores perdidos (missing
values)
o Técnicas de comparación entre métodos
o Ejercicios avanzados
Desarrollo de un proyecto de Descubrimiento de
Información en bases de datos haciendo uso de la plataforma
KNIME. El alumno escogerá un problema sobre el que trabajar
de entre los ofrecidos y deberá realizar las diferentes
tareas del proceso de descubrimiento de conocimiento:
- Preparación de los datos (Práctica 1)
- Extracción de modelos mediante técnicas de
minería de datos (Práctica 2)
- Visualización de los resultados (Práctica 3)
- Validación de los modelos (Práctica 4)
ACTIVIDADES | HORAS PRESENCIALES | HORAS TRABAJO AUTÓNOMO | TOTAL HORAS | CRÉDITOS ECTS | COMPETENCIAS (códigos) |
---|---|---|---|---|---|
A1 - Clases expositivas en gran grupo
|
16.0 | 34.0 | 50.0 | 2.0 |
|
A54 - Actividades prácticas: debates y seminarios
|
16.0 | 34.0 | 50.0 | 2.0 |
|
TOTALES: | 32.0 | 68.0 | 100.0 | 4.0 |
La asignatura se divide en dos partes fuertemente
relacionadas: teoría y prácticas.
La teoría se impartirá en su mayor parte con sesiones magistrales, incluyendo varias sesiones de actividades, resolución de dudas, realización de trabajos, y debate con las que se evaluará la participación del alumno en la asignatura. La teoría evaluará las competencias CB6, CB8,CB9, CB10, CT5, E21MIC, E22MIC.
La parte práctica se realizará en el laboratorio de informática, utilizando el ordenador para el desarrollode dichas sesiones. Se evaluará la destreza en la resolución de los programas propuestos. La participación en actividades de prácticas en el laboratorio evaluará las competencias CB7, CT3, CT4, CT5, CG1MIC, CG3MIC, E20MIC, E22MIC.
El desarrollo de trabajos dirigidos evaluará las competencias CB6, CB7, CB8, CB9, CB10, CG1MIC, CG2MIC, CG3MIC, CT3, CT4, E20MIC, E21MIC, E22MIC.
ASPECTO | CRITERIOS | INSTRUMENTO | PESO |
---|---|---|---|
Asistencia y/o participación en actividades presenciales y/o virtuales | Asistencia en actividades presenciales y/o virtuales. | . | 0.0% |
Conceptos teóricos de la materia | Examen sobre los conceptos teóricos y prácticos de la materia. | . | 20.0% |
Realización de trabajos, casos o ejercicios | Realización de trabajos, casos o ejercicios prácticos. | . | 40.0% |
Participación y Actividad en foros virtuales | Participación en actividades presenciales y/o virtuales. | . | 40.0% |
Atendiendo a lo recogido en el art. 13 del Reglamento de Régimen Académico y de Evaluación del alumnado de la Universidad de Jaén, la evaluación de la asignatura será global.
Ésta se realizará atendiendo a las actividades descritas en la sección de Metodología y Actividades.
Para aprobar la asignatura, el alumno deberá obtener una
calificación igual o superior a 5,0 sobre 10 en el
cómputo total de los aspectos evaluados, siempre y cuando
éste tenga una calificación igual o superior a 4,0 en
cada una de las partes (S2, S3, S8) evaluadas.
Las partes superadas en cada convocatoria se
mantendrán hasta final del curso.
La EVALUACIÓN se realizará
atendiendo a las siguientes actividades:
o Los conceptos teóricos de la materia: 20%. A lo
largo del curso se realizará pruebas de evaluación
contínua sobre cuestiones teóricas desarrolladas en
las clases expositivas. En este apartado se evaluarán las
competencias: CB6, CB8,CB9, CB10, CT5, E21MIC, E22MIC.
Los resultados de aprendizaje serán RB6, RB7,
RB8, RB10, RG1MIC, RG3MIC, RE24MIC.
o Realización de trabajos, casos o ejercicios: 40%. Durante el curso se realizará un trabajo documental sobre aspectos desarrollados en las clases expositivas. En este apartado se evaluarán las competencias: CB6, CB7, CB8, CB9, CB10, CG1MIC, CG2MIC, CG3MIC, CT3, CT4, E20MIC, E21MIC, E22MIC. Los resultados de aprendizaje serán RB6, RB7, RB7b, RB7c, RB8, RB9, RB10, RG1MIC, RG3MIC, RT3, RT4, RT5, RE24MIC.
o Prácticas de laboratorio/ordenador: 40%. En este
apartado se valorará la realización de las
prácticas y la entrega de la documentación
solicitada. Se evaluarán las competencias: CB7, CT3, CT4,
CT5, CG1MIC, CG3MIC, E20MIC, E22MIC. Los resultados de
aprendizaje serán RB6, RB7, RB7b, RB7c, RB9,
RB10, RG1MIC, RG3MIC, RT3, RT4, RT5, RE23MIC,
RE25MIC.
- Data mining : the textbook. Edición: -. Autor: Aggarwal, Charu C. Editorial: Cham : Springer, 2015 (C. Biblioteca)
- Introduction to machine learning. Edición: 2nd ed.. Autor: Alpaydin, Ethem.. Editorial: Cambridge, Mass. : MIT Press, 2010 (C. Biblioteca)
- Artificial intelligence : a modern approach. Edición: 3rd ed. Autor: Russell, Stuart J.. Editorial: Harlow : Pearson Education, 2014 (C. Biblioteca)
- Big Data in Engineering Applications (Studies in Big Data). Edición: 1st ed. 2018. Autor: Sanjibam. Editorial: Springer (C. Biblioteca)
- Data mining : practical machine learning tools and techniques. Edición: 4th ed.. Autor: -. Editorial: Amsterdam [etc.] : Elsevier : Morgan Kaufman, cop. 2017 (C. Biblioteca)
- Big data : técnicas, herramientas y aplicaciones. Edición: -. Autor: Pérez Marqués, María. Editorial: Madrid : RC Libros, 2015 (C. Biblioteca)
- Inteligencia artificial, inteligencia computaciones y big data. Edición: -. Autor: Herrera Triguero, Francisco. Editorial: Jaén: Universidad de Jaén, Servicio de publicaciones, 2014 (C. Biblioteca)
- Clase 1: Presentación/Tema 1
- Clase 2: Tema 1 / P1
- Clase 3: Tema 2 / P1
- Clase 4: Tema 2 / P1
- Clase 5: Tema 3 / P2
- Clase 6: Tema 3 / P2
- Clase 7: Tema 4 / P2
- Clase 8 : Tema 4 / P2
- Clase 9: Tema 5 / P3
- Clase 10: Tema 5 / P3
- Clase 11: Tema 6 / P3
- Clase 12: Tema 6 / P3
- Clase 13: Tema 7 / P4
- Clase 14: Tema 7 / P4
- Clase 15: Tema 8 / P4
- Clase 16: Tema 8 / P4