Encuentro mundial más importante en machine learning contará con 3 trabajos de investigadores UC
Hoy esta rama de la inteligencia artificial y la ciencia de la computación se encuentra, por ejemplo, tras el boom de servicios como el sistema de recomendaciones de Netflix y los autos sin conductor que recorren múltiples ciudades. En el evento NeurIPS, que este año se realizará en EE.UU. y contará con la presencia de tres papers coescritos por investigadores del Instituto de Ingeniería Matemática y Computacional UC, es donde se presentan los avances más relevantes en esta materia.
Durante las últimas dos décadas, los avances en almacenamiento y capacidades de procesamiento han dado pie a innovadoras plataformas y productos basados en el “machine learning” o aprendizaje computacional, tales como el sistema de recomendaciones de Netflix y los autos sin conductor que hoy recorren múltiples ciudades. Esta rama de la inteligencia artificial y la ciencia de la computación se enfoca en el uso de datos y algoritmos para intentar replicar la manera en que los humanos aprenden, con el fin de ir mejorando cada vez más la exactitud de sus servicios.
En ese contexto, Pablo Barceló, director del Instituto de Ingeniería Matemática y Computacional (IMC), comenta que debido al boom de la inteligencia artificial hoy la conferencia Neural Information Processing Systems (NeurIPS) se ha “transformado en el lugar donde se presentan muchas de las investigaciones más relevantes a nivel global sobre aprendizaje computacional”. La versión 2023 se hará en diciembre, en New Orleans (EE.UU.), e incluirá tres papers de investigadores UC pertenecientes tanto al IMC como al Centro Nacional de Inteligencia Artificial (CENIA) y el Instituto Milenio Fundamentos de los Datos (IMFD).
Pablo Barceló, quien además es investigador de CENIA y el IMFD, comenta que en los trabajos que estarán en NeurIPS no sólo “aparece el nombre de los autores sino que también sus afiliaciones. Eso ayuda a que la gente en el exterior diga: ‘en Chile hay un Centro Nacional de Inteligencia Artificial, existe un instituto Milenio Fundamentos de los Datos, funciona un Instituto de Ingeniería Matemática y Computacional’. Eso empieza a poner en el radar del mundo a los investigadores locales”.
Uno de los papers en los que participa el director del IMC se titula “A theory of link prediction via relational Weisfeiler-Leman” y aborda los grafos de conocimiento. “Son formas de representar información semántica. Con eso me refiero a información que tiene una interpretación que pueda ser entendida tanto por humanos como por las máquinas. Pueden ser muy grandes y lo que hacen es correlacionar entidades, señalando por ejemplo ‘esta persona es amiga de esta persona’ o ‘esta molécula está vinculada a esta otra’”, comenta Barceló.
El investigador agrega que el objetivo de las “grandes arquitecturas de machine learning es que utilicen estos grafos para adquirir información semántica que les permita aprender con menos datos”. Sin embargo, en general la “calidad de los datos es muy baja e incompleta. La idea es cómo extraer esa información faltante, cómo aprender de la estructura del grafo para poder decir ‘mira, con alta probabilidad estas dos personas igual se conocen’”.
Una de las formas más eficaces de generar la información no disponible es aplicar un tipo especial de redes neuronales llamadas redes neuronales de grafos. “Hacemos una teoría completa de qué es lo que hacen estas redes”, explica Barceló. Al entender mejor qué hacen, también es posible entender qué funcionalidades son necesarias. “Mientras menos tenga una red, mejor aprende, ya que generaliza mejor. Hacemos una especie de limpieza y podemos encontrar su núcleo fundamental, lo que hace que tengan un mejor rendimiento al realizar predicción de conexiones”, agrega.
¿Qué usos podría tener esa información? El estudio de las interacciones entre moléculas para el desarrollo de nuevos fármacos es sólo uno. “También se podría tener un grafo de transacciones y empezar a detectar, a partir de su estructura, posibles fraudes. Si sé que hay un fraude y al analizar el grafo veo que hay una estructura similar se podría decir ‘Con alta probabilidad acá también hay un fraude’ y así investigar más a fondo”, precisa Barceló.
Simetrías aproximadas y redes neuronales de grafos geométricos
Mircea Petrache, académico del IMC en cargo compartido con la Facultad de Matemáticas e investigador de CENIA, es coautor de dos papers que se presentarán en NeurIPS. El primero se titula “Approximation Generalization Trade-offs under (Approximate) Group Equivariance” y explora cómo las simetrías aplicadas en modelos de aprendizaje pueden mejorar la precisión y la eficiencia.
Para explicar este fenómeno, Petrache usa el ejemplo de reconocer gatos en imágenes: “Imagina que tienes una red neuronal que debe decir si hay un gato en una imagen y dónde está.” En este caso, no importa exactamente dónde se encuentre el gato en la imagen, sólo se necesita saber si hay uno y su forma. "Esto que parece natural para los humanos, identificar que un gato en distintas posiciones es el mismo gato, implementarlo en una red neuronal requiere implementar modificaciones de las arquitecturas, produciendo lo que se llama redes neuronales equivariantes”. El académico agrega: “Si comprendemos las simetrías, o reglas matemáticas subyacentes, y las incorporamos en la estructura de la red neuronal, podemos obtener resultados más precisos”.
El último paper que se presentará en NeurIPS se titula "Three iterations of (d − 1)-WL test distinguish non isometric clouds of d-dimensional points", y tiene como autores a Pablo Barceló, Mircea Petrache, Cristóbal Rojas (IMC-CENIA) y los investigadores de postdoctorado Valentino Delle Rose y Alexander Kozachinskyi (IMC-IMFD-CENIA).
Cristóbal Rojas comenta que el trabajo surge de una pregunta presente en la comunidad científica que utiliza redes de grafos geométricos para clasificar, predecir y trabajar con representaciones de moléculas y sus propiedades físicas, por ejemplo para crear medicamentos. Para lograrlo, ocupan diferentes versiones de esta herramienta, pero no saben cuál es la mejor para cada caso porque no existe una guía clara que permita elegir la versión adecuada.
Por eso, el paper representa un gran logro, ya que establece un teorema que guía a quienes programan estas herramientas sobre cuál versión usar y cómo configurarla para obtener los mejores resultados. “Nuestro teorema cierra el problema y ahora la respuesta está completa. Este fue un aspecto puntual que destacó uno de los revisores del artículo”, concluye Rojas.