Buscan potenciar con inteligencia artificial la comunicación en personas con dificultad en el habla

Un equipo de científicos del Conicet trabaja en el desarrollo y optimización de nuevos sistemas de comunicación aumentativos y alternativos (SAACs) de alta tecnología a través de inteligencia artificial (IA), orientados a la inclusión de personas con dificultades para comunicarse mediante el habla.

Nacionales 13/12/2023
SAACs-1 conicet

Los SAACs de alta tecnología son sistemas de comunicación basados en pictogramas y teclados virtuales, a través de los cuales, distintos usuarios con dificultades en el habla pueden transmitir mensajes.

El proyecto fue uno de los seleccionados en la segunda edición de la convocatoria Soluciones Innovadoras para Desafíos de Software, organizada por el Ministerio de Ciencia, Tecnología e Innovación y la Fundación Sadosky en 2023.

Esta iniciativa está destinada a financiar iniciativas de innovación en software y servicios informáticos de empresas nacionales que brindan soluciones a demandas concretas de la sociedad, precisó el Consejo Nacional de Investigaciones Científicas y Técnicas (Conicet) en un comunicado.

Matías Núñez, líder del proyecto de investigación, detalló que su interés era "incorporar machine learning (aprendizaje automático) con procesamiento de lenguaje natural a la interface de comunicación desarrollada por Neufitech, con el objetivo concreto de hacerla más ágil y mejorar la calidad de vida de la gente que los usa como única forma de comunicación".

Neufitech es una empresa de la ciudad de Bahía Blanca que desarrolla SAACs y otros productos de alta tecnología vinculados a la evaluación neuropsicológica, y su interfaz de comunicación consiste en un detector de movimiento ocular y un software que toma esos movimientos y los traduce a la posición de un cursor en una pantalla.

De esta forma, los usuarios eligen las diferentes palabras para escribir, en este caso, esas palabras o conjunto de palabras están representadas por pictogramas (signos pictóricos que pueden entenderse sin texto ni explicaciones adicionales).

También, es traducido a un sintetizador de voz opcional para pasar del sonido a lo escrito. El sistema basado en pictogramas se adecúa a cada persona y la idea para mejorar el enfoque inicial fue crear un predictor de pictogramas con el objetivo de acelerar este proceso.

Este proceso "lleva un tiempo de espera que hace lenta la comunicación y nuestra tarea inicial fue acelerar este proceso para mejorar la interacción del usuario con la interfaz y mejorar su comunicación", explicó Núñez.

Asimismo, indicó que la idea en la segunda parte del proyecto es aplicar modelos de lenguaje de gran tamaño, large language models (LLM), combinado con modelos de imágenes.

"El ejemplo más popular de un LLM es ChatGPT una aplicación de chatbot de IA, pero en nuestro caso nos enfocamos al uso de modelos de lenguaje de código abierto", agregó.

Asimismo, comentó que los usuarios del sistema "podrían ampliar su interacción, expresividad y lo que pueden hacer con la computadora, no sólo como predictor de pictogramas sino también como herramienta de creatividad".

"Para una persona inmovilizada que solo puede comunicarse a través del movimiento de sus ojos, estas nuevas funcionalidades podrían ser un gran cambio de calidad de vida", sentenció.

Así, en esta segunda etapa se agregan nuevas funcionalidades al sistema para potenciar las capacidades de expresión de las personas.

"La articulación del sistema científico tecnológico con diversos actores de la sociedad permite potenciar proyectos de innovación y desarrollo, promoviendo y brindando respuesta a las problemáticas sociales puntuales", precisó el Conicet en un comunicado.

Y agregó que este desarrollo es "uno de los ejemplos que muestra la transferencia en el marco de proyectos asociativos del sector público al privado".

Te puede interesar
Lo más visto