Stability AI lanza SDXL 0.9: un salto en la generación de imágenes con IA

El pasado 22 de Junio, Stablity AI, la empresa detrás de la ya famosa Stable Diffusion,📸 que compite con Midjourney y DALLE 2 de OpenAI, anunciaba su nuevo modelo SDXL 0.9.

Stability AI anuncia SDXL 0.9, el desarrollo más avanzado de la suite de modelos Stable Diffusion text-to-image. Tras el exitoso lanzamiento de Stable Diffusion XL beta en abril, SDXL 0.9 produce una mejora masiva en detalle de imagen y composición respecto a su predecesor.

El modelo puede ser accedido hoy a través de ClipDrop, y pronto estará disponible la API. Los pesos para investigación ya están disponibles y se espera una liberación abierta para mediados de julio a medida que avanzamos hacia la versión 1.0.

🔎 Cómo usar Stable Diffusion SDXL 0.9: Solo con ir a la web de ClipDrop es suficiente, pero solo te permitirá generar unas pocas imágenes, para poder generar muchos más tendrás que registrarte y verificar la cuenta con un número de teléfono, y así obtendrás 100 créditos. ClipDrop ofrece varios servicios de edición de imágenes por IA, cada uno gasta una cantidad distinta de créditos. Una vez se acaban puedes comprar créditos para seguir usando sus servicios. Probar Stable Diffusion SDXL 0.9 en ClipDrop.

A pesar de su capacidad para funcionar en una moderna GPU para consumidores, SDXL 0.9 representa un salto en los casos de uso creativos para la imaginería generativa con IA. La capacidad de generar creaciones hiperrealistas para películas, televisión, música y videos instructivos, así como ofrecer avances para diseño e uso industrial, sitúa a SDXL en la vanguardia de las aplicaciones reales para la imaginería con IA.

Comparación ⚔️

Algunos ejemplos de los indicadores probados en ambos SDXL beta y la nueva versión 0.9 muestran cuánto ha avanzado este modelo en solo dos meses. Las imágenes generadas por la nueva versión(0.9), tienen la marca de agua de ClipDrop.

Prompt usado: “a robot driving a tesla in tokyo photographed by a professional nikon camera”.

Left ImageRight Image

Prompt usado: “motoko kusanagi walking through the streets of berlin”.

Left ImageRight Image

Prompt: Glowing jellyfish floating through a foggy forest at twilight.

Left ImageRight Image

La serie SDXL también ofrece una gama de funcionalidades que van más allá del mero indicador de texto. Estos incluyen indicador de imagen a imagen (introduciendo una imagen para obtener variaciones de esa imagen), inpainting (reconstrucción de partes faltantes de una imagen) y outpainting (construcción de una extensión sin costuras de una imagen existente).

Mejoras técnicas 😮

El motor clave de este avance en composición para SDXL 0.9 es su aumento significativo en la cuenta de parámetros (la suma de todos los pesos y sesgos en la red neuronal en la que se entrena el modelo) sobre la versión beta.

SDXL 0.9 tiene una de las mayores cuentas de parámetros de cualquier modelo de imagen de código abierto, con un modelo base de 3.5B de parámetros y un pipeline de modelo de conjunto de 6.6B de parámetros (la salida final se crea ejecutando en dos modelos y agregando los resultados). El segundo modelo del pipeline se utiliza para agregar detalles más finos a la salida generada de la primera etapa.

A modo de comparación, la versión beta funciona con 3.1B de parámetros y utiliza solo un modelo.

SDXL 0.9 se ejecuta en dos modelos CLIP, incluido uno de los modelos OpenCLIP más grandes entrenados hasta la fecha (OpenCLIP ViT-G/14), que aumenta la capacidad de procesamiento de 0.9 y la capacidad de crear imágenes realistas con mayor profundidad y una resolución más alta de 1024×1024.

Se lanzará un blog de investigación que entrará en mayor detalle sobre las especificaciones y las pruebas de este modelo por el equipo de SDXL en breve.

Requisitos del sistema 🖥️

A pesar de su potente salida y avanzada arquitectura de modelo, SDXL 0.9 es capaz de funcionar en una moderna GPU para consumidores, necesitando solo un sistema operativo Windows 10 o 11, o Linux, con 16GB de RAM, una tarjeta gráfica Nvidia GeForce RTX 20 (o equivalente de mayor nivel) equipada con un mínimo de 8GB de VRAM. Los usuarios de Linux también pueden usar una tarjeta AMD compatible con 16GB de VRAM.

Estadísticas de lanzamiento de la beta 🧪

Desde el lanzamiento de la beta de SDXL el 13 de abril, hemos tenido grandes respuestas de nuestra comunidad de usuarios de Discord, que ya casi alcanzan los 7,000. Estos usuarios han generado más de 700,000 imágenes, promediando más de 20,000 por día. Más de 54,000 imágenes han sido ingresadas en las ‘Showdowns’ de la comunidad de Discord, con 3,521 imágenes de SDXL nominadas como ganadoras.

Disponibilidad 🌐

SDXL 0.9 ya está disponible en la plataforma Clipdrop de Stability AI. Los clientes de Stability AI API y DreamStudio podrán acceder al modelo este lunes 26 de junio, así como otras herramientas líderes de generación de imágenes como NightCafe.

SDXL 0.9 se proporcionará solo para fines de investigación durante un período limitado para recopilar comentarios y refinar completamente el modelo antes de su lanzamiento abierto general. El código para ejecutarlo estará disponible públicamente en Github.

Si los investigadores desean acceder a estos modelos, pueden solicitarlo a través del siguiente enlace: SDXL-0.9-Base model, y SDXL-0.9-Refiner. Por favor, inicie sesión en su cuenta de HuggingFace con su correo electrónico académico para solicitar acceso. Recuerde que actualmente, SDXL 0.9 está destinado exclusivamente para fines de investigación.

¿Qué sigue? 🌱

A SDXL 0.9 le seguirá la liberación abierta completa de SDXL 1.0 prevista para mediados de julio (fecha por confirmar).

Licencia ©️

SDXL0.9 se lanza bajo una licencia no comercial, solo para investigación, y está sujeta a sus términos de uso.

Like