En esta biblioteca indicaremos textos y recursos útiles para el estudio de Formación Adaptativa, y las técnicas de Análisis de Datos (incluyendo la Minería de Datos), especialmente las relacionadas con los Datos Educativos:

– ROMERO, Cristobal , VENTURA, Sebastian ,PECHENIZKY,  Mykola , BAKER, Ryan S.J.D.  Handbook of Educational Data Mining (Chapman & Hall/CRC Data Mining and Knowledge Discovery Series). 2010. Estupendo manual compendio de numerosos autores, que cubre desde los principios estadísticos básicos para aplicar con rigor la minería de datos en educación, hasta ejemplos concretos de experiencias con las técnicas más habituales. Lo veo imprescindible para  iniciarse en esta materia.

–   Heimo H. Adelsberger , Kinshuk , Jan Martin Pawlowski  . Handbook on Information Technologies for Education and Training (International Handbooks on Information Systems) . 2008. Casi 500 págs de resúmenes clasificados en 4 temas: tecnología, reusabilidad, e-pedagogía y perspectiva organizacional. Comprable  en la editorial como ebook y por capítulos. Adquirí esta actualización  completa para ponerme al día leyendo el ebook cuando voy en transporte público. La editorial te envía otras publicaciones de interés relacionadas a partir de su compra.

–  LIU, Bing. WEB DATA MINING. Springer, 2011. Proporciona una buena introducción a los fundamentos de la minería de datos, mostrando los algoritmos básicos del aprendizaje supervisado y no supervisado, análisis de links (incluyendo análisis de redes sociales), y minería de opinión.  Se pueden obtener recursos para poner en práctica todo lo visto en  la http://www.rdatamining.com/, si como yo, has optado por utilizar el entorno de programación R y sus librerías de minería. No cubre el preprocesado de datos, pero hay suficientes referencias que sí lo hacen. A nivel práctico, me ha funcionado mejor el lenguaje Perl que el R para el preprocesado, donde he recurrido a los O’Reilly.

PEÑA, Daniel. ANÁLISIS DE DATOS MULTIVARIANTES. McGrawHill. 2002. Creo que es uno de los mejores manuales sobre estadística multivariante, pues no solo expone las técnicas con claridad, sino que proporciona el concepto estadístico  de las herramientas matemáticas. Incluye una introducción a algunas técnicas aplicadas en Minería de Datos, como la de máquinas de vector soporte. Es bueno para autoestudio: tiene web de recursos.

HASSTIE, T., TIBSHIRANI, R. , FRIEDMAN, J. The Elements of Statistical Learning, data Mining, Inference and Prediction. Springer, 2008. Libro de texto completo de aprendizaje estadístico automático, tanto supervisado como no supervisado: Métodos lineales, métodos de alisado del Kernel, modelos de inferencia, boosting y árboles aditivos, redes neuronales, máquinas de vector soporte,»random forest», … y métodos de Big Data. Los ejercicios del libro son bastante conceptuales, pero en el link a los recursos del libro se pueden descargar librerías en R para la aplicación de las técnicas más recientes. Es difícil para autoaprendizaje.

BALCAZAR, J.L. (UNED, Febrero 2012). Minería de Datos.: Excelente resumen con los puntos clave de la Minería de Datos (diapositivas en español).

SAYAD, S. Didáctico libro en inglés, en formato página web, con hiperlinks desde esquema de técnicas: Sintético y abundantes figuras que van al concepto. Incluye ejercicios que propone realizar con «Orange Data Mining» (yo prefiero R).

SANZ MENÉNDEZ, Luis. Análisis de redes sociales: o cómo representar las estructuras sociales subyacentes. CSIC. Artículo introductorio (en español) para iniciarse en el análisis de redes sociales y la interpretación de sus indicadores. Muy claro.

–  WASSERMAN, Stanley; FAUST, Katherine. Análisis de redes sociales. Métodos y aplicaciones. Ed. por el CIS. 2013. Es el mejor libro de Análisis de Redes Sociales que he estudiado: bien estructurado, con abundantes ejemplos que se pueden replicar con cualquiera de las herramientas del mercado (Gephi, SocnetV, …), y que te enseña a interpretar los indicadores a nivel sociológico, no solo a calcularlos. Proporciona una introducción a la teoría de grafos con un enfoque riguroso pero sin excederse con las matemáticas, y muy orientado a la sociología y al tratamiento de la «centralidad». Clasifica los capítulos por dificultad. Perfecto para autoaprendizaje. Aunque la edición de Cambridge es anterior, tiene total vigencia.

VLADIMIR CHERKASSKY, V. y MULIER, F. . «LEARNING FROM DATA. Concepts, Theory, and Methods«. WILEY IEEE Press. 2007. Tiene un enfoque práctico hacia el aprendizaje automático, partiendo de los conceptos de Vapnik–Chervonenkis que introdujeron las máquinas de vector soporte y otras técnicas de minería de datos.  Compara las técnicas y aconseja sobre su rendimiento. Es claro en las explicaciones, pero no tiene web de recursos. Complementa al HASSTIE- TIBSHIRANI- FRIEDMAN.

(50)