Desarrollan inteligencia artificial que resuelve una prueba cognitiva visual

spregelburd - Alimac

A continuación les presentamos un fragmento de la nota extraída de extraída de blog de tecnología: ” Los investigadores desarrollan inteligencia artificial que resuelve una prueba cognitiva visual basada en matrices”

Las pruebas de opción múltiple brindan a los examinados la capacidad de comparar respuestas para eliminar opciones (o adivinar la correcta). Cada elección se puede comparar con la pregunta para inferir patrones que podrían haberse pasado por alto; Podría decirse que es la capacidad de reducir la respuesta correcta a partir de conjuntos de respuestas que es la prueba de la verdadera comprensión.

Inspirados por esto, investigadores de la Universidad de Tel Aviv y Facebook desarrollaron un modelo de aprendizaje automático que genera respuestas a la Matriz Progresiva de Raven (RPM), un tipo de prueba de inteligencia donde el objetivo es completar la ubicación en una cuadrícula de imágenes abstractas. . Los coautores afirman que su algoritmo no solo es capaz de generar un conjunto plausible de respuestas competitivo con los métodos más avanzados, sino que podría usarse para construir un sistema de tutoría automático que se ajuste a las competencias de los estudiantes individuales.

RPM es una prueba no verbal que se utiliza normalmente en entornos educativos como las escuelas. Por lo general, es un examen de ítem 60 que se administra para medir el razonamiento abstracto, que se considera una estimación no verbal de la inteligencia fluida (es decir, la capacidad de resolver problemas de razonamiento novedosos). Cada pregunta, un solo problemaz, consta de ocho imágenes colocadas
en una cuadrícula de tamaño 3 x 3. La tarea es generar la novena imagen que falta en la tercera fila de la tercera columna de modo que coincida con los patrones de las filas y columnas de la cuadrícula.

RPM combina lo que los investigadores describen como vías: reconstrucción, reconocimiento y generación. La vía de reconstrucción proporciona supervisión para que cada imagen se codifique en una representación numérica y se agregue a lo largo de filas y columnas. La vía de reconocimiento da forma a las representaciones de una manera que hace que la información semántica sea más explícita. En cuanto a la vía de generación, se basa en incrustar la representación visual de la primera vía y la incrustación semántica obtenida con la ayuda de la segunda para mapear la representación semántica de una pregunta dada en una imagen.

En un experimento que involucra un conjunto de datos de problemas de matrices llamado RAVEN-FAIR, los investigadores informan que su modelo alcanzó 60. 8% de precisión general . “Nuestro método presenta resultados de generación muy convincentes. Los métodos de reconocimiento más avanzados consideran que la respuesta generada es la correcta en una probabilidad que se acerca a la respuesta de verdad fundamental ”, escribieron. “Esto es a pesar de la naturaleza no determinista del problema, lo que significa que la respuesta generada es a menudo completamente diferente… de la imagen de verdad básica. Además, demostramos que la capacidad de generación captura la mayoría de las reglas, con poco descuido de las específicas ”.

Más allá de las posibles aplicaciones en educación, los investigadores afirman que el cambio de seleccionar una respuesta de un conjunto cerrado a generar una respuesta podría conducir a métodos de aprendizaje automático más interpretables. Debido a que la salida generada puede revelar información sobre el proceso de inferencia subyacente, los modelos como el suyo, dicen, podrían ser útiles para validar la lógica de la máquina a través de la implementación de sistemas de IA.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *