Kandinsky — open-source модель генерации фотореалистичных изображений на основе текстового описания.
Данная модель работает на основе CLIP-ViT‑G и позволяет вносить локальные изменения в изображение через ControlNet.
Максимальный размер генерируемых изображений = 1024.
Необходимую информацию для работы с моделью можно найти в репозитории Kandinsky.
👌 В репозитории есть ссылки на код инференса, LoRA-файтюниг модели и её чекпоинты под различные задачи (ControlNet, Inpainting и т.д.).
❗ Если у вас возникли проблемы с получением доступа, пишите аккаунту поддержки хакатона.