В оновленні Gemini додали нову модель генерації музики — Lyria 3. У бета-режимі вона дає можливість створювати 30-секундні музичні композиції на основі текстових запитів або зображень.
Lyria 3 — це найновіша модель генерації музики від Google DeepMind, яка відтепер інтегрована в застосунок. Користувач може завантажити фото або описати ідею — на основі цих даних система створює музичну композицію. Наприклад, можна сформулювати запит: «комічний R&B-трек про шкарпетку, що знайшла свою пару» — і отримати готовий трек. Також доступна можливість створення музики на основі завантажених файлів, йдеться в блозі компанії.
Нова версія моделі Lyria 3 має три вдосконалення:
- тексти пісень створюються автоматично відповідно до запиту користувача, без потреби надавати їх окремо;
- розширено можливості керування параметрами композиції, зокрема стилем, вокальними особливостями та темпом;
- модель забезпечує створення більш реалістичних і музично складніших треків.
Інструмент передбачає кілька форматів взаємодії. Користувач може описати жанр, настрій або конкретну ідею, щоб отримати композицію зі словами або інструментальний трек. Також можна завантажити фото чи відео, після чого система аналізує їхній вміст і створює музичний супровід із текстом, що відповідає заданому настрою.
Кожен 30-секундний трек супроводжується унікальною обкладинкою, яку генерує модель Nano Banana. Результат можна завантажити у вигляді файлу або поширити за допомогою посилання. Усі аудіофайли, створені в застосунку, містять SynthID — невидимий цифровий водяний знак для ідентифікації контенту, згенерованого штучним інтелектом Google. Користувачі також можуть завантажити аудіофайл до Gemini та перевірити, чи був він створений за допомогою ШІ від Google: система перевіряє наявність SynthID і проводить власний аналіз.
Компанія повідомляє, що від запуску Lyria у 2023 році розвиток технології відбувається з урахуванням співпраці з музичною спільнотою. Під час роботи над Lyria 3 враховували питання авторського права та партнерських угод. У навчанні моделі використовували досвід, отриманий під час спільних проєктів та експериментів, зокрема в межах ініціативи Music AI Sandbox.
Зазначають, що створення музики за допомогою Lyria 3 призначене для оригінального самовираження, а не для імітації конкретних виконавців. Якщо в запиті згадується певний артист, система використовує це як орієнтир для стилю або настрою, створюючи нову композицію. Користувачі можуть повідомляти про контент, який, на їхню думку, порушує права. Використання сервісу передбачає дотримання Умов використання та Правил щодо забороненого використання генеративного ШІ, які забороняють порушення прав інтелектуальної власності та конфіденційності.
Lyria 3 поступово впроваджуватимуть у бета-версії всіма мовами, які підтримує застосунок Gemini. Передплатники Google AI Plus, Pro та Ultra отримають вищі ліміти використання.
Раніше ми писали, що Google презентував нову функцію ШІ-асистента Gemini