Компанія Microsoft представила інструмент, що може створити фотореалістичний аватар людини, анімувати його та надати голос.
Azure AI Speech text-to-speech avatar вже доступна у попередньому перегляді. Дозволяє користувачам створювати відео, де аватар говорить за сценарієм.
Ця анімована людина може мати вигляд особи з фото, яке завантажує користувач.
Інструмент навчає модель керувати анімацією, тоді як інша модель перетворює текст на мовлення та читає сценарій вголос. Аватар може мати голос, створений ШІ, або схожий на голос реальної людини.
Аватари можуть говорити кількома мовами. Для сценаріїв можна використовувати моделі штучного інтелекту, такі як GPT-3.5 OpenA.
Щоб боротися зі зловживаннями інструментом більшість передплатників Azure матимуть доступ лише до готових, а не до налаштованих аватарів під час запуску інструменту.
Користувацькі аватари наразі доступні лише за реєстрацією та тільки для певних випадків використання.