La evaluación del alumnado es el rompecabezas del profesorado. Y es que determinar el proceso de desarrollo de los estudiantes a lo largo el curso, es una de las tareas más complejas y que más tiempo requiere en los quehaceres del personal docente.

Sin embargo, todo ello puede cambiar gracias a la fuerte entrada de las nuevas tecnologías en el ámbito educativo, y más en concreto, en las aulas. Todo se resume en el fenómeno ampliamente conocido como Inteligencia Artificial. Una herramienta que ahora se ha demostrado que puede servir de alternativa a esta costosa tarea de maestros. 

De esta forma lo evidencia un estudio elaborado por la Universidad del País Vasco, al que DIARIO DE NOTICIAS DE ÁLAVA ha tenido acceso, que ha contado con la participación del doctor Héctor Galindo, profesor en el campus vitoriano y miembro del grupo investigador ESCUTIC (Escuela, Currículum y TIC).

La tarea de evaluar al alumnado es una de las más costosas en tiempo y esfuerzo. Los profesores invierten entre “un tercio y hasta la mitad de su tiempo profesional” en esas tareas

Un informe que además acaba de ser publicado en la prestigiosa revista científica de tecnología Educativa EDUTEC y que muestra que las diferentes herramientas basadas en IA son capaces de “replicar bastante bien” los patrones de los docentes en formación –es decir universitarios que será futuros maestros– a la hora de evaluar tareas escritas.

Ordenador con Chat GPT. EP

Y de esas herramientas, es ChatGPT la que ha demostrado ser la mejor al obtener una mayor precisión; cerca del del 70% equiparándola con el profesorado. Asimismo, el segundo lugar lo ocupa Copilot de Bing con un acierto del 50%.

En relación a ambos parámetros, el estudio remarca que los resultados obtenidos son “conscientes” con la limitada información que existe sobre este tema, por lo que sí se han encontrado pequeñas diferencias entre la labor de los docentes y la respectiva a la IA, relacionadas con el rendimiento académico estos jóvenes docentes en formación.

Sin ir más lejos, aquellos con un desempeño más alto, proporcionaron evaluaciones más alineadas con las ofrecidas por la IA que aquellos con un nivel más bajo.

La inteligencia artificial está cada vez más presente en nuestras vidas. Freepik

Metodología utilizada

Entrando a detalle, la prueba piloto se ha llevado a cabo con 507 estudiantes universitarios de 20 años de media, provenientes de los grados de Educación Infantil (130), Educación Primaria (327) y 50 de áreas relacionadas; Pedagogía o Educación Social.

A todos ellos, se les proporcionó una rúbrica para evaluar doce textos escritos de diferentes tipos –como descriptivos, narrativos– así como de distinta calidad; excelente o mejorable, entre otras. 

Asimismo, los cuatro criterios fundamentales con los que se construyó la herramienta de IA fueron el contenido, la organización, el vocabulario y, por último, la coherencia y cohesión; de entre los que se puede destacar la gramática, la puntuación o la longitud del texto, por ejemplo. Aunque cada ensayo podía recibir una puntuación máxima de 16, se optó por ponderarlos sobre 10 para ser “más prácticos”. 

Pequeños matices

Sin embargo, toda investigación tiene sus limitaciones y, las de este estudio en concreto, sus creadores destacan que todos esos resultados podrían variar si los mismos participantes se evaluaran en unos años, cuando estén ejerciendo la profesión de maestro.

En este sentido, apostillan que sería “interesante” comparar las evaluaciones de docentes novatos, educadores de media carrera y docentes veteranos, ya que esto podría revelar importantes perspectivas sobre cómo la experiencia puede influir en los procedimientos de evaluación.

Asimismo, otra de las limitaciones es que la muestra solamente ha considerado la evaluación de trabajos escritos, por lo que no asegura esa precisión de la IA con el profesorado en formatos como audio, vídeo, imágenes o ecuaciones matemáticas. 

Por otro lado, cabe indicar que los textos escritos analizados han sido realizados por la IA que simulaba ser un estudiante de diez años, por lo que remarcan que las conclusiones obtenidas podrían variar utilizando escolares reales.

Una persona aprendiendo a usar un ordenador Cedida

IA, gran aliada de maestros en su trabajo

De entre las múltiples funciones que desempeña el profesorado durante su labor educativa, la tarea de evaluar al alumnado es una de las más costosas en tiempo y esfuerzo. Sin ir más lejos, invierten entre “un tercio y hasta la mitad de su tiempo profesional” en tareas relacionadas con la evaluación y calificación.

Investigaciones citadas en el documento de la UPV certifican que la IA es más detallada en vocabulario y gramática a la hora de poner nota a los textos

De esta forma lo ha dado a conocer el profesor de la UPV en Vitoria e investigador del grupo ESCUTIC, Héctor Galindo, a este periódico a través de un estudio sobre la IA y la tarea evaluativa del personal docente.

“Enseñar a los futuros docentes nuevos conocimientos y habilidades para evaluar a sus futuros alumnos podría ser esencial para hacer la tarea de enseñanza lo más eficiente posible”, destacan sus creadores.

Y, en ese marco, apostillan que estudios previos muestran importantes limitaciones en la manera en que se enseña a los profesores en formación a evaluar; bien porque es excesivamente teórico o porque está desconectado de las tareas diarias de un docente activo.

Ilustración de Chat GPT. Pixabay

Evaluación digital con IA

Pero, sin duda, donde este análisis pone el foco es en la potencialidad de la Inteligencia Artificial en el área educativa, ya que permite la optimización de las tareas de los docentes. En este sentido, uno de los principales resultados del estudio es que la IA podría ser una herramienta de apoyo que guíe el conocimiento pedagógico de los estudiantes que serán futuros maestros.

“Enseñar a los futuros docentes nuevos conocimientos y habilidades para evaluar a sus futuros alumnos podría ser esencial para hacer la tarea de enseñanza lo más eficiente posible”

En un esquema más general, la investigación recoge que con los avances tecnológicos de los últimos años, algunos de los métodos de evaluación que se están utilizando para abordar problemas como la alta ratio de estudiantes por docente, la instrucción personalizada y la reducción del tiempo excesivo, implican el uso de sistemas basados en inteligencia artificial. 

En el panorama actual, existe una abundancia de herramientas basadas en IA capaces de replicar el comportamiento humano; en mayor o menor medida, claro está.

Y dentro de ese campo, un área en expansión es la IA generativa, enfocada en crear contenido basado en las entradas del usuario. En este sentido, algunas de las más importantes generativas más importantes en la actualidad son ChatGPT de OpenAI, Copilot de Bing o Gemini de Google, entre muchas otras.

Detalles de la ‘IA generativa’

La herramienta contempla aplicaciones que sirven para evaluar las tareas de los estudiantes ya que, como recopilan en el citado estudio, se ha demostrado su precisión al proporcionar retroalimentación. 

En esa línea, estos sistemas de IA, apoyados por el procesamiento de lenguaje natural, son capaces de ofrecer respuestas personalizadas para complementar el esfuerzo de los docentes. De hecho, investigaciones citadas en el documento de la UPV certifican que la IA es más detallada en vocabulario y gramática a la hora de poner nota a los textos.