Американська компанія Nvidia розробила нейромережу під назвою VideoLDM, яка здатна генерувати відео за текстовим описом.
Нейромережа генерує відео з роздільною здатністю до 1280×2048 пікселів з частотою 24 кадри за секунду і враховує близько 4,1 млрд параметрів, з яких 2,7 млрд навчаються на відео.
Як приклади Nvidia показала згенеровані відео за описами: “Вдягнена в костюм лисиця, що танцює в парку”, “Самотній мандрівник у туманному лісі на світанку”, “Снігова людина у заметіль” та інші.
Оскільки це лише дослідницька розробка, про появу нової нейромережі у публічному доступі поки що не йдеться.