Дослідники Google створили штучний інтелект, який може писати музичні фрагменти за текстовими підказками.
Розробка MusicLM створює музику у формі моделювання секвенції до секвенції на 24 кГц, яка залишається постійною протягом кількох хвилин. Експерименти розробників Google показують, що цей проєкт перевершує попередні системи за якістю звуку та за дотриманням текстового опису. Крім створення музики, ШІ може імітувати людський вокал, проте поки що це виходить зернисто або статично.
MusicLM може орієнтуватися як на текстовий опис потрібної композиції, так і на насвистування чи наспівування користувача.
Поки що програмою можуть користуватися лише розробники. Проте, щоб підтримати майбутні дослідження, Google публічно випустив бібліотеку MusicCaps. Вона містить 5,5 тисяч пар “музика з ШІ — текст із розширеним текстовим описом, наданим експертами-людьми”.