Kandinsky | Notion

ℹ Краткое описание сервиса

Kandinsky — open-source модель генерации фотореалистичных изображений на основе текстового описания.

Данная модель работает на основе CLIP-ViT‑G и позволяет вносить локальные изменения в изображение через ControlNet.

Максимальный размер генерируемых изображений = 1024.

💡 Полезные материалы

Необходимую информацию для работы с моделью можно найти в репозитории Kandinsky.

Ссылка на репозиторий (GitHub)
Статьи на Хабр (рекомендуются к ознакомлению)
Документация к API
Kandinsky-видео: репозиторий, Telegram-бот (на данный момент отсутствует в API)

👌 В репозитории есть ссылки на код инференса, LoRA-файтюниг модели и её чекпоинты под различные задачи (ControlNet, Inpainting и т.д.).

🔓 Как получить доступ?

Чекпоинты модели и код инференса находятся в свободном доступе в репозитории.
Ссылка на Telegram-бота, через которого можно осуществлять необходимую генерацию по тексту.
Для получения доступа к API и ключа для него необходимо зарегистрироваться на сайте https://fusionbrain.ai и зайти в раздел API, чтобы выпустить ключ.

❗ Если у вас возникли проблемы с получением доступа, пишите аккаунту поддержки хакатона.

🚫 Ограничения и технологии

Основной язык для работы с Kandinsky — Python
Ограничение скорости генерации изображения — 7 секунд на GPU А100**.**

🍀 Общие советы участникам