Black Forest Labs, una compañía formada por antiguos ingenieros de Stability AI, ha desarrollado Flux, una herramienta de generación de imágenes con inteligencia artificial (IA) a partir de textos, que está revolucionando el sector. Se trata de un potente modelo de IA de texto a imagen de código abierto que busca ampliar los límites de la creatividad, eficiencia y diversidad en la generación de imágenes.
El sistema capaz de generar imágenes fotorrealistas partiendo de descripciones en lenguaje natural está demostrando que saca el máximo rendimiento a los algoritmos y genera imágenes de alta resolución y definición de detalles de forma más precisa. Y destaca por una de sus características: su capacidad para escribir textos dentro de la propia ilustración generada, lo que implica un salto en la calidad de generación de imágenes.
El proyecto lo ha desarrollado el equipo de Black Forest Labs, al frente del cual están los ingenieros Robin Rombach, Andreas Blattmann y Dominik Lorenz, que provienen de Stabilty AI, y conocidos como desarrolladores de los modelos de Stable Diffusion, un motor de inteligencia artificial diseñado para crear imágenes a partir de texto (Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers). Al equipo se ha unido Patrick Esser. “Creemos que la IA generativa será un componente fundamental de todas las tecnologías futuras. Al poner nuestros modelos a disposición de una amplia audiencia, queremos llevar sus beneficios a todos, educar al público y mejorar la confianza en la seguridad de estos modelos. Estamos decididos a construir el estándar de la industria para los medios generativos”, aseguran sus impulsores.
También de texto a video
La herramienta Flux.1 ha irrumpido en un mercado altamente competitivo y está demostrando su profunda comprensión del lenguaje, con lo que puede entender e interpretar las descripciones más complejas y convertirlas en creaciones detalladas y coherentes. Muchos usuarios están comenzando a crear imágenes para luego usarlas como punto de partida en la generación de vídeos. De hecho, este será el próximo paso que dará el equipo de Black Forest Labs, que ya ha anunciado sus planes para desarrollar un conjunto de sistemas generativos de texto a vídeo, mediante un programa que, de momento, ha bautizado con el nombre Sota.
Creemos firmemente que los modelos de acceso generalizado no solo fomentan la innovación y la colaboración en la comunidad de investigación y el mundo académico, sino que también aumentan la transparencia, que es esencial para la confianza y la adopción generalizada. Nuestro equipo se esfuerza por desarrollar tecnología de la más alta calidad y hacerla accesible a la mayor audiencia posible”, determina la estrategia de Black Forest Labs.
31 millones de financiación
El desarrollo y distribución de Flux.1 ha sido posible gracias al cierre de una ronda financiación inicial por 31 millones de dólares (28,44 millones de euros) por parte de Andreessen Horowitz, principal inversor de Black Forest Labs, y varios business angels, como Brendan Iribe, Michael Ovitz, Garry Tan, Timo Aila y Vladlen Koltun. Asimismo, el equipo ha recibido inversiones de seguimiento de General Catalyst y MätchVC.
Black Forest Labs tiene como objetivo desarrollar y promover modelos de aprendizaje profundo generativo de última generación para diversas formas de medios, como imágenes y vídeos, y ampliar los límites de la creatividad, la eficiencia y la diversidad.
Diversas versiones
Bk Lorenz, que provienen de Stabilty AI, y conocidos como desarrolladores de los modelos de Stable Diffusion, un motor de inteligencia artificial diseñado para crear imágenes a partir de texto (Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers). Al equipo se ha unido Patrick Esser. “Creemos que la IA generativa será un componente fundamental de todas las tecnologías futuras. Al poner nuestros modelos a disposición de una amplia audiencia, queremos llevar sus beneficios a todos, educar al público y mejorar la confianza en la seguridad de estos modelos. Estamos decididos a construir el estándar de la industria para los medios generativos”, aseguran sus impulsores.
“Creemos firmemente que los modelos de acceso generalizado no solo fomentan la innovación y la colaboración en la comunidad de investigación y el mundo académico, sino que también aumentan la transparencia, que es esencial para la confianza y la adopción generalizada. Nuestro equipo se esfuerza por desarrollar tecnología de la más alta calidad y hacerla accesible a la mayor audiencia posible“, determina la estrategia de Black Forest Labs.