Minería de Datos - Especializacion en Gestión y Tecnología del Conocimiento

JUSTIFICACIÓN


El conocimiento es uno de los principales activos de cualquier organización, proceso, o actividad humana. En estos días, la informática ha permitido, además, almacenar grandes cantidades de
datos, con lo urge la necesidad de transformar esa gran cantidad de datos en conocimiento que sea analizable, compresible y útil para las personas.

Este curso pretende formar a los alumnos para que adquieran las principales competencias necesarias para transformar datos almacenados en conocimiento, de manera que puedan aportar un valor, cualquiera que sea su actividad, puesto que los procesos de análisis de datos se pueden
llevar a cabo en la mayor parte de las actividades que nos rodean.

DESCRIPCIÓN

La minería de datos engloba al conjunto de herramientas necesarias para generar información a
partir de grandes cantidades de datos. Estas herramientas. El análisis de datos (data mining)
integra distintas tecnologías de distintos campos como las bases de datos, la estadística, y la
inteligencia artificial. La minería de datos compete una gran cantidad de tareas, como la
visualización de datos, la reducción de dimensionalidad, la regresión, la clasificación, el
agrupamiento de información, la búsqueda de asociaciones entre datos, etcétera.
La minería de datos ha recibido un gran auge en los últimos años, debido fundamentalmente a la
digitalización de grandes cantidades de información, que a la vez ha sido muy potenciado por
Internet. Los datos digitalizados alimentan el proceso de análisis de datos, que tiene como
salida un conocimiento que tiene alguna utilidad para el usuario del proceso de minería de datos.
Entre las aplicaciones clásicas del análisis de datos se encuentran en los negocios, hábitos de
compra y/o perfiles de clientes, obtención de patrones de comportamiento de usuarios, adaptación a usuarios, análisis de secuencias de proteínas, ingeniería, juegos, robótica, y un largo
etcétera.

En la actualidad existen algunas herramientas que facilitan los procesos de minería de datos. Entre ellas, cabe destacar WEKA, desarrollado en University of Waikato, y muy ampliamente
utilizada por la comunidad académica, pero también por empresas y grandes corporaciones.


OBJETIVOS GENERALES

La minería de datos engloba al conjunto de herramientas necesarias para generar información a partir de grandes cantidades de datos. Estas herramientas. El análisis de datos (data mining) integra distintas tecnologías de distintos campos como las bases de datos, la estadística, y la inteligencia artificial. La minería de datos compete una gran cantidad de tareas, como la visualización de datos, la reducción de dimensionalidad, la regresión, la clasificación, el agrupamiento de información, la búsqueda de asociaciones entre datos, etcétera.

La minería de datos ha recibido un gran auge en los últimos años, debido fundamentalmente a la digitalización de grandes cantidades de información, que a la vez ha sido muy potenciado por Internet. Los datos digitalizados alimentan el proceso de análisis de datos, que tiene como salida un conocimiento que tiene alguna utilidad para el usuario del proceso de minería de datos.

Entre las aplicaciones clásicas del análisis de datos se encuentran en los negocios, hábitos de compra y/o perfiles de clientes, obtención de patrones de comportamiento de usuarios, adaptación a usuarios, análisis de secuencias de proteínas, ingeniería, juegos, robótica, y un largo etcétera.

En la actualidad existen algunas herramientas que facilitan los procesos de minería de datos. Entre ellas, cabe destacar WEKA, desarrollado en University of Waikato, y muy ampliamente utilizada por la comunidad académica, pero también por empresas y grandes corporaciones.



COMPETENCIAS BÁSICAS

  • Conocer una metodología para desarrollar procesos de análisis de datos
  • Conocer los principales algoritmos utilizados en el análisis de datos
  • Conocer las principales aplicaciones y herramientas para el análisis de datos
  • Comprender los objetivos del análisis de datos, así como los principales pasos necesarios para su ejecución
  • Comprender las diferencias entre los distintos objetivos de un proceso de análisis de datos, discerniendo entre clasificación, regresión, agrupación, etcétera
  • Capacidad para utilizar alguna herramienta para realizar procesos de minería de datos
  • Capacidad para analizar un problema de minería de datos, y saber distinguir qué herramientas, métodos y pasos se han de seguir para resolverlo
  • Capacidad para analizar la salida de los algoritmos de análisis de datos, y obtener conclusiones sobre su validez, con capacidad de crítica
  • Capacidad para, a partir del conocimiento de los distintos algoritmos de análisis de datos, elaborar procesos de análisis de datos completos y satisfactorios para los usuarios
  • Ser capaz de criticar y evaluar los distintos algoritmos de análisis de datos, sabiendo distinguir las ventajas e inconvenientes de cada uno
  • Capacidad de crítica de los resultados de un proceso de análisis de datos


BIBLIOGRAFÍA BÁSICA Y COMPLEMENTARIA

Bibliografía básica:

- Ian H. Witten and Eibe Frank (2005) "Data Mining: Practical machine learning tools and techniques", 2nd Edition, Morgan Kaufmann, San Francisco, 2005.
- D. Borrajo, J. González y P. Isasi, Aprendizaje Automático, Sanz y Torres, 2006
- T.M. Mitchell, Machine Learning, McGraw Hill, 1997


Bibliografía complementaria:

- Pattern classification and scene analysis. Richard O. Duda and Peter E. Hart. John Wiley & Sons, cop. 1973
- B. Sierra et al., Aprendizaje automático: conceptos básicos y avanzados. Aspectos prácticos utilizando el software WEKA, Pearson Education, 2006