Nuevos principios para mejorar la confiabilidad de los artistas AI

Investigadores de UNIST proponen un enfoque innovador para entrenar modelos de difusión, mejorando su robustez y capacidad de generalización en la generación de imágenes.

07/11/2025 | 05:58Redacción Cadena 3

FOTO: Principios de diseño para artistas AI más confiables y seguros

Cuando los usuarios solicitan a ChatGPT que genere una imagen en el estilo de Ghibli, la imagen real es creada por DALL-E, una herramienta impulsada por modelos de difusión. Aunque estos modelos producen imágenes impresionantes, como la transformación de fotos en estilos artísticos o la creación de personajes personalizados, también enfrentan ciertas limitaciones. Estas incluyen errores ocasionales, como manos con tres dedos o rostros distorsionados, y desafíos para funcionar en dispositivos con recursos computacionales limitados, como los teléfonos inteligentes, debido a su gran cantidad de parámetros.

Un equipo de investigación, liderado por los profesores Jaejun Yoo y Sung Whan Yoon de la Escuela de Graduados en Inteligencia Artificial de UNIST, propuso un nuevo principio de diseño para la inteligencia artificial generativa que aborda estos problemas. A través de análisis teóricos y experimentos extensivos, demostraron que entrenar modelos de difusión para alcanzar "mínimos planos"—un tipo específico de punto óptimo en la superficie de pérdida—puede mejorar simultáneamente tanto la robustez como la capacidad de generalización de estos modelos.

Su estudio fue presentado en la Conferencia Internacional sobre Visión por Computadora (ICCV 2025), y los hallazgos están publicados en el servidor de preprints arXiv.

Los modelos de difusión son ampliamente utilizados en aplicaciones populares de inteligencia artificial, incluyendo herramientas como DALL-E y Stable Diffusion, que permiten realizar tareas que van desde la transferencia de estilo y la creación de caricaturas hasta la representación de escenas realistas. Sin embargo, desplegar estos modelos a menudo conduce a desafíos, como la acumulación de errores durante ciclos de generación cortos, degradación del rendimiento tras técnicas de compresión de modelos como la cuantización, y vulnerabilidad a ataques adversariales—pequeñas perturbaciones maliciosas en la entrada diseñadas para engañar a los modelos.

El equipo de investigación identificó que estos problemas surgen de limitaciones fundamentales en la capacidad de los modelos para generalizar, es decir, su capacidad para funcionar de manera confiable con datos nuevos o en entornos desconocidos.

Para abordar esto, el equipo propuso guiar el proceso de entrenamiento hacia "mínimos planos"—regiones en el paisaje de pérdida del modelo caracterizadas por superficies amplias y suaves. Tales mínimos ayudan al modelo a mantener un rendimiento estable y confiable a pesar de pequeñas perturbaciones o ruidos. Por el contrario, los "mínimos agudos"—valles estrechos y empinados—tienden a causar un deterioro del rendimiento cuando se enfrentan a variaciones o ataques.

Entre los diversos algoritmos diseñados para encontrar mínimos planos, el equipo identificó la Minimización Consciente de Agudeza (SAM) como la más efectiva. Los modelos entrenados con SAM demostraron una reducción en la acumulación de errores durante tareas de generación rápidas, mantuvieron salidas de mayor calidad después de la compresión, y exhibieron un aumento de siete veces en la resistencia a ataques adversariales, mejorando significativamente su robustez.

Mientras que investigaciones anteriores abordaron problemas como la acumulación de errores, errores de cuantización y vulnerabilidades adversariales por separado, este estudio muestra que centrarse en los mínimos planos ofrece una solución unificada y fundamental a todos estos desafíos.

Los investigadores destacan que sus hallazgos van más allá de simplemente mejorar la calidad de imagen. Proporcionan un marco fundamental para diseñar sistemas de inteligencia artificial generativa confiables y versátiles que pueden aplicarse de manera efectiva en diversas industrias y escenarios del mundo real. Además, este enfoque podría allanar el camino para entrenar modelos a gran escala como ChatGPT de manera más eficiente, incluso con datos limitados.

Lectura rápida

¿Qué se propuso?
Un nuevo principio de diseño para modelos de difusión que mejora su robustez y capacidad de generalización.

¿Quiénes lideraron la investigación?
Los profesores Jaejun Yoo y Sung Whan Yoon de la Escuela de Graduados en Inteligencia Artificial de UNIST.

¿Cuándo se presentó el estudio?
En la Conferencia Internacional sobre Visión por Computadora (ICCV 2025).

¿Cómo se mejora la robustez de los modelos?
Entrenando modelos para alcanzar "mínimos planos" en la superficie de pérdida.

¿Por qué es importante este enfoque?
Ofrece una solución unificada a problemas como la acumulación de errores y vulnerabilidades adversariales.

Temas

Lo último

04:22 Mundo

Decisión judicial sobre vacunas. Juez frena recorte de vacunas infantiles en Estados Unidos

04:01 Mundo

Múltiples explosiones en un mercado y hospital. Maiduguri: atentados suicidas dejan al menos 23 muertos y más de 100 heridos

03:56 Tecnología

Crisis humanitaria en el Mediterráneo. Cientos de migrantes desaparecen en el Mediterráneo: falta de información alarmante

02:28 Mundo

Crisis en la industria vitivinícola. Bodegas argentinas enfrentan retos ante la disminución del consumo de vino

02:09 Mundo

San Antonio se impone en un emocionante encuentro. Los Spurs logran 50 victorias tras vencer 119-115 a los Clippers

Escuchá lo último

Audio. Marcharon por justicia en Córdoba a un año de la brutal golpiza a Martín Cáceres
Turno Noche
Episodios
Audio. Masiva peregrinación a Carreta Quemada en la festividad de Brochero
Noticias
Episodios
Audio. Culto y tradición en Villa Cura Brochero por el natalicio del santo patrono
Noticias
Episodios
Audio. Celebración en Villa Santa Rosa por el legado de Brochero en la Argentina
Noticias
Episodios
Audio. Cura Brochero: Tradición y fe en la cabalgata de peregrinos de Villacura
Noticias
Episodios
Audio. El Presidente Milei habla sobre inflación en Córdoba tras gira internacional
Noticias
Episodios
Audio. La Cámpora convoca a movilizarse en apoyo a Cristina Fernández ante tribunales
Panorama Federal
Episodios
Audio. La Cámpora convoca a movilización en apoyo a Cristina Fernández en su indagatoria
Panorama Federal
Episodios
Audio. Juan Carlos Rabbat: “El país necesita una educación que le dé alas a la gente”
La Argentina, hoy
Episodios
Audio. La Fórmula 1 y el rally cordobés: grandes emociones del último fin de semana
Panorama Federal
Episodios
Audio. Estafas en Rosario en nombre de ARCA: alertas desde la Municipalidad.
Viva la Radio Rosario
Episodios
Audio. Poder adquisitivo golpeado: cada vez más personas eligen segundas y terceras marcas.
Viva la Radio Rosario
Episodios
Audio. Investigan a Javier Milei por presunta estafa en el caso Libra de criptomonedas
Noticias
Episodios
Audio. Inundaciones en Tucumán: Contingencia para animales afectados por el agua
Noticias
Episodios
Audio. Mendoza será sede del evento manicero más grande del mundo.
Informados al regreso
Episodios
Audio. La provincia se hará cargo de las obras en el Monumento a la Bandera en Rosario
Noticias
Episodios
Audio. Gabriel Bornoroni y Luis Juez analizan el rumbo de la Argentina y la inflación
Noticias
Episodios
Audio. UPC rechaza propuesta salarial y convoca a paro de 48 horas en Córdoba
Noticias
Episodios
Audio. Rector de la UNR alerta sobre paro docente y situación salarial crítica
Noticias
Episodios
Audio. Hinchas de Belgrano proponen un proyecto para limpiar el barrio y reciclar
Viva la Radio
Episodios