Temas interesantes

HUAWEI FASHION FLAIR: LA INTELIGENCIA ARTIFICIAL AL SERVICIO DEL TALENTO Y CREATIVIDAD HUMANOS

Por Davide Bacciu, professor de Machine Learning en el departamento de aprendizaje computarizado de la Universidad de Pisa, y miembro del comité ejecutivo en la Asociación Italiana para la Inteligencia Artificial.

El corazón de la inteligencia detrás de la aplicación Fashion Flair es uno de los modelos de redes neurales más populares en años recientes, conocido como Redes Adversas Generativas (GAN, por sus siglas en inglés). El documento científico que estableció las bases metodológicas fue escrito apenas en 2014, no obstante, han ganado un importante rol entre los modelos más estudiados y desarrollados en la comunidad de Deep Learning. La razón de este éxito puede ser encontrada en la relativa facilidad con la que es posible entrenar al modelo para generar información nueva y compleja de un modo extremadamente realista, haciendo un pronóstico cualitativamente indistinguible de los datos originales utilizados para el aprendizaje del modelo.
El campo de aplicación de más impacto de GAN es en el que se generan imágenes fotorrealistas. En este sentido, las imágenes sintéticas generadas por la red tendrán características estilísticamente coherentes con el contexto de los ejemplos utilizados para el entrenamiento, pero con características originales con respecto a dichos ejemplos. En otras palabras, las imágenes generadas por la red pueden ser consideradas como nueva información, inventada por la red neural. Un segundo aspecto digno de destacar del modelo GAN es la posibilidad de regular el proceso de generación de información, controlando los aspectos tanto estilísticos como de contenido. Por ejemplo, en el contexto de la generación de imágenes “sintéticas” de rostros, esta habilidad es utilizada para ejercer variaciones en la edad de los sujetos mostrados conforme a las necesidades o deseos del usuario. Esta misma característica es usada en la aplicación “Fashion Flair” para controlar la generación de piezas de vestimentas variando los patrones de estilo, forma y cortes.
El entrenamiento de GAN está basado en la idea de que sea igualmente sencillo y poderoso. La fase de aprendizaje prevé la presencia de dos redes neurales artificiales, llamadas respectivamente Generador y el Discriminador. El primero tiene el propósito de generar información sintética y realista partiendo de los datos ingresados, que no son más que un vector de números casuales. El segundo, por otro lado, está entrenado para reconocer si los datos presentados en la fase de ingreso de información es un ejemplo sintético producido por el Generador o si se trata de un ejemplo real. Las dos redes están enfrentadas en una suerte de juego de policías y ladrones, donde el Discriminador incrementa su habilidad para discernir entre los ejemplos reales y los sintéticos, forzando al Generador a ser cada vez más eficiente en producir ejemplos realistas. Al final del entrenamiento sólo se conserva el Generador, y bastará con simplemente darle cierta información para tener la correspondiente información sintética, fiable y entrenada. A través de la manipulación de este vector de entrada, la aplicación “Fashion Flair” es capaz de generar imágenes de piezas de vestimenta en diversos estilos.
El proceso de entrenamiento del GAN utilizado en la aplicación “Fashion Flair” es, en realidad, más complejo. El punto de partida para el trabajo de entrenamiento es una colección de 30,000 imágenes de piezas de moda vintage y modernas. En esta primera colección fueron utilizadas técnicas de Inteligencia Artificial y visión artificial para optimizar la calidad de las imágenes reales utilizadas para el aprendizaje y permitirle al modelo del Generador enfocarse en la creación de la parte de la imagen que muestra la pieza de vestimenta sin tomar en cuenta la información periférica, como el fondo, las características físicas, o la pose del modelo. Para incrementar el número de ejemplos y utilizar en el aprendizaje fueron implementadas técnicas de recolorización y transformación en las imágenes. Adicionalmente, el modelo GAN utilizado por la aplicación es un pariente lejano de la primera implementación más simple publicada en 2014. De hecho, utiliza una variante conocida como StyleGAN, presentada por investigadores de NVIDIA a finales de 2018 y que hoy representa lo más avanzado en generación de imágenes sintéticas.
Las características más importantes de StyleGAN son su habilidad de producir imágenes realistas en alta resolución (previamente sólo era posible lograr imágenes de muy baja resolución) y la posibilidad de capturar los aspectos estilísticos de las imágenes en atributos específicos controlables por la red. A través de la manipulación de estos atributos numéricos, la aplicación puede, en principio, cambiar de forma independiente aspectos específicos de las piezas de vestimenta como el color, longitud, decoración y corte. El proceso de entrenamiento de GAN requiere cálculos intensivos, por lo que dichos cálculos fueron realizados en centros de cálculo con sistemas especializados de alto desempeño y aceleradores de hardware. La generación de las imágenes de las piezas de vestimenta del GAN entrenado es, por otro lado, gestionada directamente en la aplicación instalada en el smartphone, gracias al poder de cálculo del procesador Kirin 980 y el soporte ofrecido por la ejecución de sus redes neurales y por su poder de procesamiento de imágenes.
La Inteligencia Artificial parece que está destinada a jugar un papel cada vez más central en el diseño de modas pues incluso KDD, una de las conferencias científicas líderes en el campo de la Inteligencia Artificial, ha ofrecido un taller anual sobre la convergencia de la tecnología de IA, la moda y el diseño desde 2016. En este interesante contexto, Fashion Flair se distingue como el primer ejemplo público de cómo una red neural puede ser utilizada de forma interactiva por un diseñador para obtener inspiración y crear atuendos de vanguardia.

Acerca de Davide Bacciu
Davide Bacciu es Senior Assistant Professor de Machine Learning en el departamento de aprendizaje computacional de la Universidad de Pisa, donde imparte cursos en Deep Learning y reconocimiento de patrones.
Además de su experiencia magisterial, Davide Bacciu es un miembro del comité ejecutivo de la Asociación Italiana para la Inteligencia Artificial (AIXIA), una asociación científica sin fines de lucro fundada en 1988 que busca promover la investigación y difusión de técnicas científicas específicas para la IA, para motivar su enseñanza y promover la investigación teórica y aplicada en el campo a través de seminarios, iniciativas específicas e incluso a través del patrocinio de eventos.
Sus áreas de interés de investigación se encuentran en las áreas de Machine Learning, con particular énfasis en las redes neurales, modelos generativos, procesamiento adaptativo de datos estructurados y sistemas de aprendizaje para robótica e IoT. Ha sido coautor de más de 80 artículos científicos en estos temas y ha participado en numerosos proyectos de investigación internacionales. Actualmente es miembro del comité técnico de la IEEE CIS (Sociedad de Inteligencia Computacional), una compañía profesional del Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) enfocado en la “teoría, diseño, aplicación y desarrollo de paradigmas motivados biológica y lingüísticamente con énfasis en redes neurales, sistemas de conexión, algoritmos genéticos, programación evolutiva, fuzzy systems y sistemas híbridos inteligentes que contengan dichos paradigmas”.
Ha dado presentaciones en renombrados centros de investigación, incluyendo la Universidad de Heidelberg, la Royal Statistical Society, King’s College London y el Instituto Italiano de Tecnología. En 2009 recibió el premio E. R. Caianiello como el mejor investigador italiano con tesis en redes neurales.

Yesica Flores

Soy Yes, blogger desde hace más de 5 años. Me he especializado en el viejo y olvidado arte de divagar. Contacto [email protected]

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.