Ayuda:Kandinsky 12b
Kandinsky 12b es uno de los modelos más nuevos (en Junio del 2022) para la generación de imágenes basada en redes neurales adversariales (GAN, Generational Adversarial Network). Fue creado por Shonenkov.
La dinámica básica es simple: A partir de un prompt de texto, la red neural itera una imagen (o en este caso, una cantidad de imágenes en paralelo) y muestra el resultado final. De este modo, con los parámetros normales, son generadas 16 imágenes cuadradas; nominalmente de la misma temática (al menos, compartiendo el prompt). Al momento de la escritura, estas imagenes son de 256x256 píxeles cada una.
Es uno de los modelos creados desde la base de código abierto de ruDALL-E. Kandinsky 12b parece enfocarse en el "estilo surrealista" y usa más parámetros que el modelo original. El código completo del Kandisnky todavía no se encuentra disponible para el público en general, aunque se está en el proceso de liberar notebooks del modelo.
Está entrenado para que su lenguaje sea en idioma ruso. Los prompts en inglés son traducidos, pero la traducción es imperfecta y los resultados no son los ideales.
Kandinsky 12b se encuentra en un estado experimental. No ofrece públicamente servicios de suscripción por pago.
El uso en su canal de Discod es gratis, pero solo se puede colocar un prompt cada dos horas, cada hora o cada media hora (dependiendo de la congestión del servidor). Los prompts tardan varias horas en ser generados, puesto que se colocan en cola con los de todos los demás usuarios.
Las imágenes generadas por Kandinsky 12b pueden usarse para proyectos propios, tan solo con dar crédito al modelo y a "Shonenkov AI" (el emprendimiento del ingeniero de software responsable).
Telegram: shonenkovAI
Véase también
- Ensayos:IA y cyberpunk, escrito por el creador de Kandinsky 12b.
⚜️
Artículo redactado por NimoStar Para proponer cualquier cambio o adición, consulte a los redactores. |