Ayuda:Entrenamiento de modelos de IA

De Bestiario del Hypogripho

Ícono de desambiguaciónVer Anexo:Lista de entrenamiento de modelos de IA

ADVERTENCIA DE FALTA DE CONTENIDO: Este artículo es un borrador, que se encuentra (evidentemente) incompleto.
El contenido podría continuar siendo extendido por sus autores en el futuro previsible.

Este artículo tiene contenido abordado desde la perspectiva de la "vida real".     Este artículo se compone de contenidos transcritos o recopilados por Jakeukalane.  Este artículo carece de imágenes ilustrativas. Puedes ayudarlo consiguiendo una (o más) imágen/es apropiada/s e incorporándola/s.  Este artículo carece de bibliografía real que sustente su contenido; se beneficiaría de su adición.  Este artículo es de dificultad intraficcional negligible o nula (0). Debería ser apto para todo público. 

Entrenamiento de una IA

Es el primer paso, se entrena una Inteligencia Artificial siguiendo pares de texto e imagen. Aquí entran en juego codificadores y descodificadores. El resultado final será un modelo ckpt (bastante grande, más de 2 GB). Una IA así es por ejemplo Stable Diffusion 1.5. También se puede hacer referencia al proceso de afinar un modelo.

Afinar un modelo

Es el proceso de entrenar una IA de manera adicional.

Dreambooth

Con Dreambooth se entrena el modelo en sí en una serie de imágenes. Generalmente son necesarias unas 20 imágenes + 2000 imágenes de regularización. Si tu modelo solo se basa en 20 imágenes, eso estaría muy sobreajustado (overfit). Las imágenes de regularización son simplemente un conjunto de imágenes generadas aleatoriamente. Diluyen el nuevo concepto en el resto del modelo.

Inversión textual / incrustación de texto

La imagen aproximada de la inversión textual es como si hicieras el modelo para aprender una palabra específica. Digamos que desea que el modelo genere un color completamente diferente. Lo harás con la incrustación de texto (embedding).

En una descripción más técnica, la inversión textual encuentra los tokens (las cosas que representan las palabras en el prompt) que dan lo que desea (lo que está en las imágenes de entrenamiento) del modelo que usa para entrenarlo.

La incrustación no entrena al modelo en sí mismo y genera ficheros .pt de entorno a 20 MB.

LORA

LORA entrena a partes del modelo.

Referencias

  • Gracias a thaad#5122 y a Drakkon#9764 por su paciencia en responder a mis dudas.

Véase también

⚜️

   Artículo transcrito o recopilado por Jakeukalane
Por favor, consulta rigurosamente la bibliografía antes de cambiar o añadir algo a las transcripciones.