Технологии создания дипфейков работают на основе генеративно-состязательных сетей (GAN). 14 Они состоят из двух частей: генератора и дискриминатора. 1
Генератор обрабатывает тысячи снимков объекта и на их основе создаёт изображения. 4 Дискриминатор пытается определить, насколько получившаяся картинка похожа на реальный объект. 4 В итоге они как бы играют друг с другом: генератор пытается обмануть дискриминатора, а дискриминатор — вычислить фальшивку. 4 Обе сети в процессе совершенствуются, в конечном итоге создавая максимально реалистичное изображение. 4
Для создания голосовых дипфейков используются автокодировщики — определённый тип нейронных сетей. 2 На вход модели подаются две аудиозаписи, при этом голос со второй записи переносится на первую. 2 В результате сказанное в первой записи озвучивается голосом человека из второй записи. 2
Чтобы создать убедительный дипфейк, требуются большие объёмы видео, статические изображения, голосовые записи, а иногда даже сканирование головы реального актёра с последующим анализом в качестве обучающих вводных данных. 3