fbpx
Кейси

Okay, Google: історія розвитку голосових асистентів

Розповідаємо про перші такі технології та використання сучасних у маркетингових стратегіях брендів
Ракша Лариса, 21.12.2021

Ритм життя сучасної людини прискорюється з кожним днем. Ми не маємо часу вивчати в повному обсязі інформацію, яку отримуємо, писати текстові повідомлення, запам’ятовувати всі майбутні події. Саме тому  набирають популярності голосові асистенти й залучають все більше користувачів. Вони заощаджують час, нагадують про важливі дати, дають поради на основі даних з інтернету та замовляють усе, що буде завантажено в систему.

Ми вивчили історію розвитку віртуальних асистентів і розповідаємо про перший такий апарат, основні складнощі, програму для розпізнавання суцільних речень. А також наводимо приклади використання таких асистентів у маркетингових стратегіях брендів.


1939

Фізик Лев М’ясников створив перший апарат для розпізнавання людського мовлення. Механізм зчитував кілька голосних і приголосних, що на той час стало проривом у світі техніки. Пристрій отримав визнання й масштабний потенціал, утім фізик та його працівники не продовжили свою розробку. Команда ніяк не прокоментувала це рішення, та все ж назвала дві основні проблеми, з якими стикнулася. Перша — це наявність однакових за звучанням, але різних за сенсом слів. Це заважало апарату розуміти сенс почутих речень. Друга — відсутність функції для приглушенння шуму. Система ловила навіть найменші звуки та зчитувала їх.


1952

Співробітники американської лабораторії Bell розробили механізм для розпізнавання продиктованих телефоном чисел від 0 до 9. Машину назвали Одрі, а точність її роботи оцінили у 90%.

Цього ж року виявили ще одну складність. Спочатку всім здавалося, що цифри зрозуміти легше, ніж слова. Але згодом розробники помітили безліч чинників, які впливають на розпізнавання. Наприклад, тембр голосу, акцент, швидкість мовлення, стать. Саме тому для якісної роботи апарату потрібно було говорити чітко, повільно та в просторі, де немає шуму.


1962

Компанія IBM презентувала технологію розпізнавання голосу під назвою Shoebox, що в дослівному перекладі означає “коробка з-під взуття”. Цією назвою розробники наголошували на компактному розмірі апарату, який розумів 16 англійських слів, 10 цифр і 6 арифметичних команд. Він отримував дані через мікрофон, передавав їх на лічильний пристрій та друкував результати на папері.


1971

Олександр Вайбель розробив алгоритм для державного проєкту. Це був апарат під назвою Harpy, який розумів 1011 слів і сприймав мовлення по частинах, що значно підвищило відсоток точності його роботи. Але проблему зі зчитуванням схожих за звучанням речень все ще не було розв’язано:

“Отже, у вас є такі речі, як евтаназія (euthanasia), яка може бути молоддю в Азії (youth in Asia). Або, якщо ви скажете: “Дайте мені новий дисплей” (Give me a new display), це можна зрозуміти як “дайте мені нудистський спектакль” (give me a nudist play).”


1986

Фредерік Джелінек створив друкарську машинку з голосовим керуванням під назвою Tangora. Вчений вважав, що не потрібно наслідувати людське мовлення в розробках — ліпше почати використовувати комп’ютерне обладнання. Новий алгоритм розширив словниковий запас апарату до 20 тис. слів і кількох речень. Щоб налаштувати його під мовленнєві особливості кожного користувача, потрібно було витратити лише 20 хвилин. Хоча машинка все ще потребувала повільного мовлення та відсутності шуму, вона все ж стала важливим досягненням галузі на початку 90-х років.


1987

Компанія World of Wonder випускає першу ляльку, що вміє спілкуватися. Розумна Джулі знала 16 слів, відрізняла день від ночі, відчувала тепло та холод. Завдяки вбудованим датчикам розмови з нею були цікавими та змістовними. Алгоритм роботи був подібний до Tangora. Лялька підлаштовувалася під голос людини, її акцент, швидкість мовлення, стать.


1997

Подружжя Бейкерів запустило першу програму для розпізнавання суцільних речень під назвою Dragon NaturallySpeaking. Вони створили те, що у 1939 році вважалось неможливим. А саме апарат, який розпізнавав сотню слів за одну хвилину. Більше не потрібно було робити довгі паузи, шукати простір без жодного шуму та хвилюватися niчерез діалекти.

Саме DNS стала першою програмою для розпізнавання мовлення на Windows.


Що відбувалося далі?

З 2001 року і до сьогодні компанії впроваджують голосових асистентів у життя людей. Спочатку можливість голосового введення тексту представила Microsoft. Одразу за нею Google запустила Voice Search. Відтак усе більше корпорацій створювали програми, за допомогою яких користувач міг проговорити свій запит, а алгоритм — його написати. Це значно заощаджувало час, а наявність певної гейміфікації залучала ще більше людей.

Починаючи з 2011 року, розробники почали знайомити аудиторію із Siri, Cortana, Alexa. Ці програми вже не просто зчитують слова, а стають усе “людянішими”, потрібними та розвиненими. Бізнеси використовують їх у рекламних кампаніях для підвищення продажів, залучення нової аудиторії. Користувачі шукають інформацію, ставлять нагадування, відстежують показники здоров’я. Вони присутні в багатьох сферах нашої повсякденності, а суспільству стає все складніше уявити життя без віртуальних помічників.


SIRI

У 2011 році компанія Apple запустила першого голосового асистента й назвала його Siri. Це був єдиний на той час помічник, що міг не лише слухати, а й відповідати користувачеві. Винахід вдалося втілити за допомогою використання голосового синтезу та нейромережі, які здатні вчитися та запам’ятовувати. Спочатку Siri працювала як окрема програма, яку потрібно було завантажувати. Але трохи згодом її вирішили додати до основних функцій усіх гаджетів. Компанія пояснила, що їй важливо, аби кожен користувач продукції Apple мав доступ до асистента. Адже ця розробка покликана полегшити життя споживачів і навіть скрасити самотність.

CORTANA

У 2014 році Microsoft представила свого голосового асистента. Попри те що велика кількість людей уже була прихильна до Siri, компанія заявила, що її помічник ще людяніший. Ім’я Cortana запозичили з ігрового всесвіту Halo через схожість з їхньою метою. А саме — створити якомога реалістичнішого цифрового персонажа та своєрідного друга для користувача. Наприклад, Cortana постійно відстежує звички, уподобання, інтереси користувача й на основі них допомагає організовувати день. Зараз Cortana не доступна на телефонах. Компанія оголосила про це рішення у 2021 році та залишає його непорушним. Головна причина — це бажання зосередитися на додаткових можливостях, які можна реалізувати через Windows.

ALEXA

У 2014 році Amazon випустила розумну колонку з голосовим помічником Alexa. Утім, аудиторія не одразу сприйняла її позитивно. Критики звинувачували Джеффа Безоса в тому, що колонка не дає жодної користі. Але компанія лише посилювала рекламу та показувала переваги створеної технології. Згодом споживачі все ж полюбили розумну колонку — вони побачили низку зручностей, які надає Alexa. Наприклад, вона може вимкнути світло, заправити машину, замовити їжу. Загалом розробники заявляють про те, що їхній асистент може виконувати більш як 500 дій.



Як бренди використовують віртуальних асистентів?

 Бренд з виробництва кормів для тварин Purina розробив команду Ask Purina у співпраці з голосовим асистентом Alexa. Завдяки цій функції користувач може за декілька секунд знайти всю потрібну інформацію щодо корму для свого улюбленця. Наприклад, дізнатися про склад, наявність у ньому алергенів, рекомендації щодо годування на основі ваги, породи та віку тварини.

 У 2019 році Reebok у співпраці з Alexa та Google Assistant запустили конкурс на лімітовану серію кросівок Club C. Щоб узяти участь у розіграші, потрібно сказати “Open Reebok Sneaker Drop” одному з віртуальних помічників. Колекцію, яка прикрашена кристалами Swarovski, неможливо купити, її можна лише виграти. Таке обмеження залучило молоду аудиторію, як і планувала маркетингова команда.

 Бренд Nike випустив кросівки Adapt BB з автоматичною шнурівкою. Вони продавалися лише під час гри баскетбольної асоціації. Усім, хто користується Google Assistant, сказали про можливість за допомогою асистента купити взуття Nike, представлене в перервах матчу. Далі на гаджеті користувача відкривався відповідний сайт із доступом до покупки. За даними компанії, всі пари  кросівок розпродали за 6 хвилин.

 Samsung представила холодильники із вбудованим помічником Bixby. Він задовольняє потреби користувача, пов’язані з продуктами. Наприклад, допомагає у пошуку будь-якої інформації, читанні новин, купівлі потрібної їжі, замовленні доставки — це все дії, які асистент виконує менш як за хвилину.

 Alexa співпрацює з фармацевтичними компаніями, що значно полегшує процес пошуку ліків. Користувач може завантажити в систему рецепт та час приймання. А голосовий помічник буде нагадувати, підраховувати залишки та навіть автоматично замовляти у вказаній аптеці ліки, коли вони закінчуються.

 Burger King запустили рекламу сендвіча на телебаченні. На екранах з’являвся працівник мережі зі словами: “Ви дивитеся 15-секундну рекламу Burger King, яка, на жаль, закоротка для того, щоб розповісти про всі свіжі інгредієнти у сендвічі з Whopper. Але в мене є ідея. Окей, Google, що таке гамбургер Whopper?”. Цей заклик активував голосового асистента, який автоматично переходив на сторінку закладу, що містив детальну розповідь про новинку від Burger King. Такий маркетинговий хід не всі сприйняли позитивно. Людям не сподобалося, що їхніми гаджетами можна так легко керувати. Але все ж рекламу помітили й активно обговорювали. 


Підтримай нас на Patreon!

 Donate

Інші статті за темами
Підписатися
Підпишись на нашу розсилку і будь в курсі всіх оновлень
Підпишись на нашу розсилку і будь в курсі всіх оновлень