Революционный способ создания изображений: Distribution Matching Distillation (DMD)

Время дороже - держи пользу без текста

1. Исследователи из Массачусетского технологического института (MIT) разработали новый метод ускорения создания изображений по текстовым описаниям. Новый метод позволяет генерировать изображения высокой чёткости в 30 раз быстрее существующих. Исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT создали метод “дистилляции с согласованным распределением” для ускорения генерации изображений. Новый метод позволяет генерировать изображение за 0,05 секунды, в то время как другие модели требуют от 1,5 секунды до нескольких проходов для создания изображения. Необходимость ускорения генерации изображений была подтверждена исследователями MIT. Результаты предыдущих попыток ускорения диффузионных моделей в Instaflow и LCM не впечатлили. Компания Stability AI добилась некоторых успехов в ускорении диффузионных моделей, но сгенерированные изображения всё равно получались заметно лучше при нескольких проходах.

Thank you for reading this post, don't forget to subscribe!

2. Подход ученых под названием Distribution matching distillation (DMD) объединяет принципы генеративно состязательных сетей с принципами диффузионных моделей. DMD состоит из двух компонентов: первый упорядочивает изображения, делая их свойства более предсказуемыми, а второй гарантирует соответствие вероятности генерации изображения моделью «учеником» реальности. Ученые скопировали и настроили параметры исходных моделей для быстрого обучения новой модели «ученика» с использованием Stable Diffusion v1 5. Новый метод DMD позволяет генерировать визуальный контент за один шаг и показал стабильную производительность при сравнении с обычными методами. DMD является первым методом одноэтапной генерации, который создает изображения практически на одном уровне с изображениями исходных, более сложных моделей. DMD справляется с преобразованием текста в изображение в промышленном масштабе. По словам авторов исследования, уменьшение количества итераций было «Святым Граалем» диффузионных моделей. Есть небольшая разница в качестве при преобразовании текста в картинки в более сложных задачах. Качество изображений, созданных с помощью DMD, может быть улучшено с помощью более продвинутых моделей «учителей».

3. Ученые из MIT разработали метод, который ускоряет генерацию изображений по текстовому описанию в 30 раз. Метод назван “дистилляцией с согласованным распределением”. Новый метод позволяет создавать изображение за один проход, в отличие от диффузионных моделей, требующих 30-50 шагов. Используется модель “учитель-ученик” для обучения новой компьютерной модели. На оборудовании Stable Diffusion 1.5 нейросеть создает изображение за 1.5 секунды, а новая модель на основе DMD делает это за 0.05 секунды. Одноэтапная модель генерации может улучшить инструменты проектирования, ускорить создание контента и помочь в открытии новых лекарств и 3D моделировании.

Революционный способ создания изображений: Distribution Matching Distillation (DMD)

Исследователи из Массачусетского технологического института (MIT) представили новый метод ускорения создания изображений по текстовым описаниям. Новая технология, именуемая Distribution Matching Distillation (DMD), объединяет принципы генеративно состязательных сетей с диффузионными моделями, открывая новые перспективы в области искусственного интеллекта.

DMD состоит из двух ключевых компонентов: первый компонент упорядочивает изображения, делая их свойства более предсказуемыми, в то время как второй компонент гарантирует соответствие вероятности генерации изображения моделью «учеником» реальности. Этот подход позволяет создавать изображения высокой четкости за один шаг, в отличие от традиционных моделей, требующих множественных проходов.

Ученые скопировали и настроили параметры исходных моделей для быстрого обучения новой модели «ученика» с использованием Stable Diffusion v1 5. Разработанный метод DMD продемонстрировал стабильную производительность и является первым одноэтапным методом генерации изображений, который создает контент на уровне более сложных моделей.

Качество изображений, созданных с помощью DMD, уже впечатляет, но авторы исследования утверждают, что можно добиться еще более высоких результатов с применением более продвинутых моделей «учителей». Этот метод не только ускоряет процесс создания изображений, но и открывает новые возможности в проектировании, создании контента и даже в медицинской сфере.

Исследования в области искусственного интеллекта продолжают удивлять нас своими достижениями, и Distribution Matching Distillation (DMD) от MIT становится новым шагом к революционным изменениям в создании визуального контента. Стремительный прогресс в этой области обещает увлекательное будущее, где возможности компьютерной генерации изображений будут безграничными.