Прорыв в генерации видео с помощью ИИ: многомодальные технологии вызывают революцию в экономике творчества

Прорыв в технологиях генерации видео с использованием ИИ: изменения и возможности

Недавним самым значительным достижением в области ИИ стало прорыв в технологии многомодальной генерации видео. Эта технология перешла от генерации видео на основе единственного текста к интеграции текстов, изображений и аудио в полное решение по генерации.

Некоторые примечательные технологические прорывы включают:

  1. Открытая структура EX-4D: может преобразовывать обычные видео в контент 4D с произвольным углом обзора, уровень одобрения пользователей достигает 70,7%. Эта технология позволяет ИИ автоматически генерировать просмотр под любым углом без необходимости в профессиональной команде 3D-моделирования.

  2. Платформа "Хуэйсян": утверждает, что может создавать 10-секундные видео в "кинематографическом" качестве из одного изображения. Конкретные результаты еще предстоит проверить.

  3. Технология Veo: способна синхронно генерировать 4K-видео и окружающий звук. Эта технология преодолевает сложности синхронизации звука и изображения в сложных сценах, такие как точное соответствие между движением ног и звуком шагов на экране.

  4. ContentV: Имеет 8 миллиардов параметров, может генерировать 1080p видео за 2,3 секунды, стоимость составляет 3,67 юаня/5 секунд. Хотя затраты контролируются должным образом, качество генерации в сложных сценах все еще имеет пространство для улучшения.

Эти технологические прорывы имеют большое значение в таких аспектах, как качество видео, стоимость создания и области применения:

  1. В аспекте технической сложности, объем вычислений, связанных с генерацией многомодальных видео, растет экспоненциально. Это требует обработки генерации одиночного кадра (примерно 10^6 пиксельных точек), обеспечения временной согласованности (по крайней мере 100 кадров), синхронизации аудио (10^4 выборок в секунду) и пространственной согласованности в 3D. В настоящее время эти сложные задачи могут быть решены благодаря модульной декомпозиции и сотрудничеству больших моделей.

  2. Снижение затрат в основном связано с оптимизацией архитектуры вывода. Это включает в себя стратегию генерации на разных уровнях (сначала генерация скелета с низким разрешением, затем улучшение содержимого с высоким разрешением), механизм повторного использования кэша (повторное использование похожих сцен) и динамическое распределение ресурсов (корректировка глубины модели в зависимости от сложности содержимого).

  3. В области влияния приложений ИИ меняет традиционный процесс производства видео. Раньше создание 30-секундного рекламного ролика могло стоить сотни тысяч. Теперь ИИ упрощает этот процесс до ввода подсказок и ожидания всего лишь несколько минут, при этом обеспечивая перспективы и эффекты, которые трудно достичь традиционной съемкой. Эта трансформация может привести к значительным изменениям в сфере экономики создателей.

Эти технологические достижения также оказали глубокое влияние на область Web3 AI:

  1. Структура спроса на вычислительные мощности изменилась. Генерация многомодальных видео требует разнообразных комбинаций вычислительных мощностей, что создает новый спрос на распределенные неиспользуемые вычислительные мощности, различные распределенные модели тонкой настройки, алгоритмы и платформы для вывода.

  2. Повышение требований к аннотации данных. Для создания профессионального видео необходимы точные описания сцен, эталонные изображения, аудиостили, траектории движения камеры и условия освещения и другие профессиональные данные. Механизмы поощрения Web3 могут стимулировать таких профессионалов, как фотографы, звукорежиссеры и 3D-художники, предоставлять высококачественные данные, что, в свою очередь, повысит возможности генерации видео с помощью ИИ.

  3. Увеличение спроса на децентрализованные платформы. Искусственный интеллект постепенно переходит от централизованного распределения ресурсов к модульному сотрудничеству, что само по себе является новым спросом на децентрализованные платформы. В будущем вычислительная мощность, данные, модели и механизмы стимулирования могут сформировать самоподдерживающийся положительный цикл, способствующий глубокому слиянию Web3 AI и Web2 AI.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
NftDeepBreathervip
· 08-13 07:05
Спекулянты снова начали говорить о ИИ!
Посмотреть ОригиналОтветить0
TopEscapeArtistvip
· 08-12 05:22
Кажется, еще один рыночный пузырь собирается нарастать. Техническая поддержка команды все еще недостаточно сильна.
Посмотреть ОригиналОтветить0
GasGrillMastervip
· 08-11 18:23
Честно говоря, 70% одобрения — это не так уж и много.
Посмотреть ОригиналОтветить0
MetaverseMigrantvip
· 08-11 18:19
Снова говорят о технологической революции!
Посмотреть ОригиналОтветить0
MidnightSellervip
· 08-11 18:04
Я в шоке, какой же это прогресс!
Посмотреть ОригиналОтветить0
  • Закрепить