Подделка голоса или монтаж видео с участниками, которых не было в кадре, де-факто прошлый век. В Университете Беркли представили пилотную технологию, которая может заставить любого человека станцевать произвольный танец. На мониторе компьютера, разумеется, указав модели персонажа выполнять различные сложные движения.
Система использует модель «палочного человечка», чтобы оцифровать поведение реального человека и научиться выстраивать различные узоры, имитирующие его движения. Это вовсе не просто, искусственному интеллекту необходим исходный материал в виде видеозаписи длительностью от 20 мин. с частотой 120 кадров в секунду или еще больше. Далее мы находим видео с исполнением желаемого танца, переводим его в палочную модель и передаем сценарий танца нейронной сети, которая произведет рендеринг и «натянет» на модель внешние атрибуты цели.
Если с повтором движений проблем нет, то для придания реализма потребовалось задействовать еще одну нейронную сеть, «цензора», который выявляет слишком явные нарушения. Палочная модель исключает возможность учесть движения свободной ткани, поэтому танцевать придется только в облегающей одежде. И если большинство танцевальных па заслоняют друг друга, у ИИ может возникнуть проблема с их распознаванием на фоне тела танцора. О точной передачи эмоций речи тоже не идет.
В целом технология выглядит донельзя сырой и даже забавной, если рассуждать о реальной подделке танцевальных видео. А, с другой стороны, чтобы сфальсифицировать такое сложно видео старыми методами, требуется несколько рабочих дней. Здесь же – один ИИ и считанные часы работы. И пусть технология вряд ли подойдет для подделки улик, она найдет применение в создании анимации и в кинематографе.
Источник — arXiV
Источник: