El futuro de la educación. El secreto está en la masa … de datos.
¿Es posible predecir el fracaso o éxito de un alumno? ¿conocer qué funcionalidades e-learning son las que provocan una mejora real en el proceso de aprendizaje? ¿Y el número de matriculaciones aproximado de un centro escolar para el próximo año?. La respuesta es sí, y a lo largo de este post de mi blog voy a intentar dar una explicación de cómo.
Primeramente, cabe comentar que, el sector educativo está formado por centros de enseñanza (públicos, concertados y privados) que buscan la manera más eficaz y productiva de transmitir conocimiento, valores y buenas costumbres a sus alumnos. Es ya habitual que los centros de enseñanza utilicen las nuevas tecnologías para acometer con éxito esa tarea, ya sea mediante el uso de herramientas ofimáticas y de gestión sencillas, o sirviéndose de plataformas educativas más complejas. Estas herramientas permiten a los mencionados centros explotar características tales como el almacenamiento masivo de datos, la automatización de procesos, o la interconexión de usuarios y documentos a través de Internet. Así, con el uso continuo durante el curso escolar de estas plataformas y herramientas, los centros de enseñanza generan una gran cantidad de datos e información que queda digitalizada y registrada. Además, gracias al uso de internet y la web en la educación (e-learning), ha aparecido un nuevo escenario en el que de manera constante se genera información de acceso ubicuo, información relacionada con la enseñanza, el aprendizaje, y la interacción alumno-profesor.
Toda esa información heterogénea generada en entornos educativos es conocida como datos educacionales. Los datos educacionales están relacionados con variados aspectos, como por ejemplo la gestión del centro, las planificaciones del profesorado, las evaluaciones, el comportamiento y participación de los alumnos, o las actividades extraescolares, entre otros. Pues bien, la información recogida en los datos educacionales puede ser explotada con el objetivo de buscar y extraer el conocimiento subyacente a ella. Así, nos encontramos en la actualidad con una corriente de investigación emergente, conocida como minería de datos educativos (EDM – Educational Data Mining).
La EDM se puede definir directamente como la aplicación de técnicas de minería de datos (DM – Data Mining) sobre datos educacionales. Dicho de otro modo, la EDM es la disciplina encargada del estudio, desarrollo e implantación de métodos para, partiendo de todos los datos heterogéneos que se generan en los entornos educativos, extraer conocimiento en forma de información interpretable, novedosa y útil a diferentes niveles (estudiante individual, clase, centro…) . Ejemplificando algunos estudios, la EDM puede ayudar a identificar qué acciones del alumno están asociadas con los mayores grados de satisfacción y aprendizaje, cuándo un estudiante está capacitado para avanzar al siguiente tema o cuándo está en riesgo de no superar satisfactoriamente el curso, qué funcionalidades e-learning son las que provocan una mejora real en el proceso de aprendizaje, qué rendimiento está ofreciendo la clase en comparación con las otras unidades de su nivel, la predicción de comportamientos en base a histórico de acciones, etc.
La EDM es un campo de investigación sobre el que se han realizado variados estudios y trabajos en los últimos años. Además, la International Educational Data Mining Society impulsa y organiza una conferencia internacional de carácter anual en la que los investigadores exponen los últimos avances, tendencias y logros conseguidos en el campo. Como consecuencia de su especialización en datos educacionales, a diferencia del DM tradicional, la EDM incide y hace hincapié en la detección y explotación de aquellas variables, parámetros y tipos de datos propios y característicos de los entornos educativos.
El conocimiento extraído a partir de la información bruta proveniente de las herramientas y plataformas educativas se convierte directamente en inteligencia de negocio, ya que a partir de ella se pueden extraer conclusiones, definir nuevas actuaciones, tomar decisiones administrativas y académicas, definir nuevas métricas de baremación y evaluación, o mejorar el entorno de aprendizaje. Todo ello tiene una importancia capital a la hora de conseguir una mejora del sistema educativo, en términos generales.
Para los centros de carácter concertado y privado, quienes tienen que competir con otros centros similares a la hora de captar alumnos suficientes, además del análisis sobre sus propios datos de manera aislada, es especialmente interesante establecer comparativas entre sus datos y aquellos asociados al resto de centros de enseñanza. Así se pueden generar interesantes análisis, representaciones y métricas estadísticas que permitan conocer la situación real del centro en un determinado entorno, ayudándoles a actuar y a tomar decisiones estratégicas con mayor confianza y seguridad, y a diferenciarse de sus competidores.
Los análisis de datos educacionales son susceptibles de ser aplicados sobre grandes cantidades de datos, siendo conveniente por tanto la utilización de tecnologías Big Data. El término Big Data agrupa, en líneas generales, tanto a las tecnologías y herramientas para al almacenamiento de grandes cantidades de información provenientes de múltiples canales heterogéneos, como a las técnicas especiales para el tratamiento e interpretación de dichos datos de una manera rápida y escalable.
La correcta combinación de la EDM con Big Data puede otorgar un gran potencial a la hora de entender y mejorar los procesos educativos. Así, el apoyo de los procesos de EDM en Big Data supone una ayuda extra en aspectos como la motivación (fomentar a que los centros estén interesados en suministrar sus datos para formar parte de la gran base de datos), realimentación y cooperación (comparativa de datos y experiencias con otros casos similares), eficiencia (tomar decisiones más seguras e inteligentes gracias al análisis de situaciones previas), o el seguimiento en tiempo real de los cursos y procesos de aprendizaje (por ejemplo, identificando qué partes resultan más complejas, cuales más visitadas, qué horas son las más activas, etc.).
Analizado todo ésto, no cabe duda pues, que el futuro de la educación pasa por el análisis de los datos educacionales. Sin embargo, y aun teniendo en cuenta los grandes beneficios enumerados, el conocimiento generado a través de la EDM y Big Data no es habitualmente utilizado ni explotado desde un punto de vista comercial.
Para ello, existen una serie de retos o problemas abiertos a afrontar, que se podrían resumir en los siguientes:
- Desarrollo de herramientas específicas para EDM.
- Integración con sistemas de e-learning o con plataformas de gestión académica: La falta de integración existente en la actualidad obliga un proceso de recopilación y preparación de datos que suele ser muy costoso
- Estandarización de métodos y datoss: En la actualidad no existen formatos estándar para la representación de datos educativos.Se trata de un problema complejo, porque existe una gran variedad de datos.Hay un par de intentos por parte de algunas organizaciones pero hasta ahora han sido infructuosos
- También se echa de en falta el desarrollo de guías de buenas prácticas para la resolución de tareas en EDM
- Validación de métodos e incorporación al proceso de enseñanza-aprendizaje
Cuando se superen estos retos, estaremos ante un apasionante futuro en el sector de la educación, con múltiples aplicaciones que ahora mismo no somos ni capaces de imaginar. El secreto está en la masa, sí, pero de datos.
FUENTES:
Data Mining in E-Learning. C. Romero & S. Ventura (Eds). Editorial WIT Press, 2006.
Handbook of Educational Data Mining. C.Romero, S. Ventura, M. Pechenizky & R. Baker (Eds). Editorial CRC Press, Taylor & Francis Group. 2010.
Education Data Mining: Applications and Trends. A. Peña-Ayala (Eds). Springer, SCI Vol. 524, 2014
http://www.educationaldatamining.org/