Сучасні технології активно розширюють можливості користувачів, орієнтуючись на доступність, безпеку та зручність у щоденній комунікації. Окуляри з функцією субтитрів для людей з порушенням слуху, новий захист Android від шкідливих застосунків, ШІ-ремікси для музики на YouTube Shorts та інноваційна система голосового перекладу DeepL — у матеріалі розглянемо детально ці новації та їхні потенційні можливості.
Перекладач DeepL отримав функцію голосового перекладу – DeepL Voice
Компанія DeepL представила нову функцію для перекладу голосу — DeepL Voice, яка в реальному часі перекладає мовлення під час розмов і відеоконференцій. Відомий своєю точністю в текстових перекладах, DeepL тепер розширює можливості платформи — користувачі можуть бачити переклад голосових повідомлень одразу на екрані. Функція підтримує англійську, німецьку, французьку, корейську, іспанську та ще декілька мов, з подальшою інтеграцією ще 33 текстових мов перекладу, пише TC.
DeepL Voice розроблено як інструмент для текстового відображення перекладу під час живого спілкування. Він допомагає співрозмовникам під час конференцій, переговорів та спілкування у сфері обслуговування. Користувачі можуть використовувати смартфони для відображення дзеркальних перекладів або бачити переклад як субтитри під час відеозв’язку в Teams, де наразі доступна ця функція. Цей інструмент базується на нових технологіях мовної обробки DeepL і здатен миттєво виводити текст, що є ключовою перевагою перед аналогічними сервісами.
Засновник компанії, Ярек Кутиловський, зазначає, що створення DeepL Voice є відповіддю на найпопулярніший запит користувачів від моменту запуску DeepL у 2017 році. Він також підкреслив важливість реального часу для якісної взаємодії, адже багато сервісів штучного інтелекту на ринку перекладають із затримкою, що ускладнює їх використання в живих розмовах. DeepL обіцяє дотримуватися загального регламенту про захист даних (GDPR) і забезпечувати приватність в обробці голосу. Аудіо передається на сервери для перекладу, але не зберігається і не використовується для навчання їхніх моделей.
YouTube тестує можливість створення музичних реміксів за допомогою штучного інтелекту
YouTube тестує функцію, що дає змогу обмеженій кількості креаторів створювати 30-секундні ремікси пісень з використанням штучного інтелекту. Функція дозволяє авторам задавати параметри для перетворення ліцензованих композицій, змінюючи їх настрій або стиль. Ремікси міститимуть посилання на оригінальну композицію, а також інформацію про ШІ-обробку. Про це повідомляє видання The Verge.
Наразі нову функцію тестують з піснями відомих виконавців, які надали права для проєкту. Серед них — Чарлі Пута, Charli XCX, Демі Ловато та Джон Ледженд.
Це розширення функції Dream Track створене для залучення музичних лейблів, які надають свої треки для навчання моделей ШІ, даючи змогу авторам ютуб-шортсів урізноманітнювати контент за допомогою реміксованої музики.
Google додав нову функцію безпеки в Google Play Protect для Android
Google додав нову функцію безпеки в Google Play Protect для Android, яка захищає користувачів від небезпечних застосунків, пише The Verge.
Оновлена функція Live Threat Detection перевіряє застосунки не лише під час завантаження. Вона також аналізує їхню активність на телефоні, щоб виявляти приховані загрози. На відміну від традиційного сканування, ця функція виявляє шкідливе ПЗ навіть тоді, коли воно приховується і починає діяти пізніше.
Попередження в реальному часі дають змогу користувачам мобільних телефонів з операційною системою Android своєчасно реагувати на загрози. Отримавши повідомлення про підозрілу активність, вони можуть видалити небезпечний застосунок.
Нова функція працює на пристрої через Android Private Compute Core, який забезпечує збереження конфіденційності даних користувача. Наразі вона доступна власникам Pixel 6 і новіших моделей, а згодом доступ розширять і для інших пристроїв на базі Android.
Крім цього, Google запускає ще один інструмент — розпізнавання шахрайських дзвінків. Із цією технологією штучного інтелекту можна виявляти підозрілі дзвінки, що мають ознаки шахрайства. Якщо виклик здається сумнівним, користувачу надійде рекомендація завершити розмову.
Спершу ця функція буде доступною в межах бета-тестування лише для власників Pixel 6 і новіших моделей через застосунок Phone by Google.
Окуляри із субтитрами в реальному часі допоможуть людям із порушенням слуху розрізняти мову співрозмовників у гучних середовищах
Компанія AirCaps розробила окуляри, які пропонують користувачам із порушенням слуху реальні субтитри під час розмов у шумному середовищі. Пристрій працює в парі з iPhone, де через мікрофон телефона звук перетворюється на текст за допомогою технології розпізнавання мови на основі штучного інтелекту, йдеться в матеріалі New Atlas.
Субтитри відображаються з внутрішнього боку лінз окулярів і дублюються на екрані телефона. Наразі AirCaps підтримує англійську, іспанську, французьку та інші мови, а ціна стартує від $699.
Окуляри поки доступні для замовлення лише в США за ціною $699. Додатково потрібно придбати лінзи з діоптріями, які коштують $150. Користувачі можуть вибрати між місячним планом за $49 з необмеженим доступом або гнучким тарифом — за $2 на годину.