fbpx
Зсередини

Що таке збір даних та як захистити себе в мережі

Розповідаємо, як працює Google, cookies і таргетинг, разом з аналітиком OSINT-аґенції Molfar
Данилюк Даяна, 26.09.2023

Жарт про те, що будь-яка інформація, потрапляючи в інтернет, там і залишається — це зовсім не жарт, а реальність, у якій ми живемо. Та чи справді варто сильно перейматися щодо захисту власних даних і обмежувати діяльність у соцмережах, коли інтернет став невідʼємною частиною життя сучасної людини?

Ми вирішили дізнатися, як працює система збору даних на сайтах і в додатках. Спробуємо зрозуміти, чого ми отримуємо більше від інформації, яку знає про нас Google — користі чи шкоди. Для цього ми поспілкувалися з ресерчером OSINT-аґенції Molfar Павлом Фіялковським.


Як компанії збирають дані про користувача?

Вся інформація, яку браузер отримує від користувача, збирається за допомогою так званих cookies. Це аж ніяк не новітня технологія — вперше про неї заговорили ще у 90-х роках. Нині ж cookies використовують усі сайти. Сookies збирають інформацію про наші поведінкові патерни: лайки, IP-адреси, місцезнаходження, кліки і зосередженість на тому чи іншому елементі сайтів та соціальні перетини. Зазвичай ми даємо згоду на використання cookies одразу, як переходимо на сторінку сайту, рідше — читаємо політику використання, в якій можна простежити, для чого саме компанія збирає інформацію про користувача.

Наприклад, власникам сайтів анкета користувача може бути корисною для взаємодії з користувачем, співпраці з партнерами та монетизації. Найчастіше cookies допомагають у роботі з Google Analytics, Google Ads і таргетованою рекламою. У застосунках вони вивчають абсолютно всю можливу інформацію про користувача. Найліпшим прикладом є Instagram — cookies вивчають, скільки часу людина проводить на сторінці, як довго розглядає пост, як взаємодіє з ним, кому пересилає. Результатом вивчення конкретного користувача є розділ “Цікаве” — саме за допомогою нього Instagram досліджує та перевіряє свої гіпотези.

В ідеальному світі це все використовують, щоб підштовхнути вас до імпульсивних покупок. Проте в реальності даними користувачів можна маніпулювати, щоб керувати свідомістю мас. Пригадаймо, наприклад, кейс із “Кембридж Аналітика”, що використовувала дані Facebook для таргетингової реклами в межах передвиборчої кампанії у США. Компанія дослідила верстви населення, які були близькі до зміни думки, за кого їм голосувати. До цієї аудиторії застосували специфічний таргет, який поволі їх переконував. Адже, знаючи наявні поведінкові патерни людей, зацікавлені особи можуть формувати нові, потрібні для нас, патерни. У цьому є найбільша небезпека. Детальніше про цей кейс можна дізнатися, переглянувши документальний фільм The Great Hack на Netflix.

Читай також: Таргетована реклама: етапи створення та покрокове налаштування. Лекція Олександри Мелешко

Нині найбільшу увагу світу привернув Китай, де західні соціальні мережі заборонені, а вітчизняні, навпаки, доволі сильно інтегровані в життя людини. До соціальних мереж під’єднана платіжна інформація і зареєструватися в них можливо лише через підтвердження особи. Власне, це і насторожує владу США та ЄС, коли йдеться про безпеку даних державних працівників, які використовують ТікТок — додаток, що належить китайській компанії. У 2023 році його заборонили використовувати всім держпрацівникам у США на пристроях, придбаних державою, та в кампусах державних університетів.

Якщо ви маєте недовіру до якогось сайту, то можете відмовитися від використання cookies. Докладніше про це можна прочитати в інструкції від Google. Проте невдовзі на заміну cookies прийде система під назвою Privacy Sandbox. Компанія Google оголосила, що з 2024 року браузер Chrome перейде на нову систему, яка намагатиметься знайти баланс між конфіденційністю і таргетуванням, що досі є найбільш затребуваною формою монетизації.

Privacy Sandbox побудована на основі API Topics, а таргет буде проводитись не чітко на одну особу, а на групу людей зі спільними інтересами. Також Google пообіцяв, що збережені інтереси користувачів зберігатимуться лише три тижні, а старі видалятимуться.

А що робити з геолокацією?

На початку повномасштабного вторгнення громадян закликали вимикати свою геолокацію — це була ІПСО. Нині цією функцією можна спокійно користуватися, адже вона полегшує роботу компаніям і додає зручності людям. Наприклад, коли бренд, банк чи онлайн-магазин хоче дізнатися вашу локацію, він може автоматично підтягувати пропозиції та каталог, актуальний для вашого міста чи країни.

Проте потрібно бути обережними саме з російськими додатками і сайтами. Деякі українці досі використовують додаток Maps.me, розробником якого є Mail.Ru Group, або ж сервіс з мапами 2-GIS, який належить власниці російського Сбербанку.

Для профілактики можна зробити перевірку всіх додатків на телефоні й сервісів, якими ви користуєтеся на компʼютері. Але з досвіду можу сказати, що розробники зазвичай повинні надавати App Store та Google Play детальну інформацію щодо збору інформації і запитати, навіщо в умовній грі отримувати геолокацію від користувача.


У чому небезпека збору даних?

Найочевидніша — те, що компанії продають дані. Адже ми ніколи не знаємо, у чиїх руках вони можуть опинитися. Люди активно користуються інтернетом і водночас все частіше задумуються про власну безпеку в мережі. Поступово це впливає і на динаміку рішень великих компаній. Вони починають уважніше ставитися до своїх систем збору даних або ж навіть повністю змінюють цю систему, як Google.

Проте потрібно розуміти, що для компаній ви як користувач не є індивідом. Наімовірніше, ви входите в якийсь сегмент людей зі спільними інтересами. Тому немає сенсу хвилюватися через те, що інтернет щось знає про вас. Повірте, у вас є власна анкета, а мережа памʼятає навіть більше, ніж ви.

Чи очікує на нас реальність, як у сюжеті “Чорного дзеркала”?

Серіал “Чорне дзеркало” доводить усі ситуації до екстремуму. У цьому його особливість і причина, з якої він став таким популярним. Увага, спойлери!

Нещодавно всі активно обговорювали першу серію шостого сезону, в якій життя головної героїні стало сюжетом для реального серіалу. Його могли побачити абсолютно всі користувачі стримінгового сервісу. Сталося це тому, що жінка надала компанії права на використання подій свого життя, коли реєструвалася. Це було прописано в політиці конфіденційності, яку зазвичай ніхто не читає і одразу погоджує.

https://www.youtube.com/watch?v=5jY1ecibLYo

Я би сказав, що нам залишається лише мріяти, щоб на великих екранах нас зіграла Сальма Гаєк. Але в реальності багато блогерів і так транслюють своє життя назагал, а деякі роблять на цьому карʼєру і заробляють гроші. Тому, цілком імовірно, що колись у майбутньому буде такий вид серіалів чи фільмів, дані для яких братимуть з агрегованих даних соцмереж, а сценарії для них створюватиме умовний чат GPT.

Та мені б хотілося обговорити інший епізод “Чорного дзеркала”, в якому жінка втратила чоловіка в автокатастрофі. За сюжетом, завдяки таргетингу вона знаходить пропозицію від компанії “Ікс”, яка стверджує, що зможе створити роботизованого клона її чоловіка, свідомість якого буде відтворена з усіх даних про нього в інтернеті. Власне, робот вийшов до моторошного правдоподібною копією її чоловіка. Це ще одна гіперболізована ситуація, яка, втім, також може стати реальною в далекому майбутньому (або ні).

Чи можна вберегтися від безжального збору даних? Напевно, ні. Всім потрібні дані про вашу поведінку, щоб краще розуміти, як продати вам сонячні окуляри, які купите саме ви. Втім, ніхто не скасовував інтернет-гігієну: чистимо або забороняємо cookies (та їх майбутні аналоги), забороняємо збір і надсилання даних там, де це можна зробити, користуємось VPN і, звісно ж, заклеюємо вебкамеру.

Читай також: Чим займається українська кіберполіція та коли до неї варто звертатися

Як можна пояснити ситуації, коли таргетинг пропонує нам товар і контент, який ми тільки-но обговорили вживу?

Можна бути певним, що Siri та Google Assistant постійно нас слухає. Ці програми для того й створені — вони чекає на специфічну команду для свого пробудження. Apple чи Google можуть використовувати ці дані для таргетингу власних продуктів. Проте, якщо ми вже користуємось їхніми продуктами, то з нашої поведінки можна зібрати й корисніші дані про нас. Варто згадати й більш популярний у США голосовий помічник Alexa від Amazon, що теж постійно слухає користувача. У нього є функція проводити покупки на Amazon через використання голосу. Відповідно, інформація про ваші розмови також потрапляє для оброблення до компанії для поліпшення таргету.

Але використовувати виключно інформацію, зібрану з прослуховування розмов користувача, недоцільно для самих компаній. Оскільки це дуже великі масиви даних, для яких потрібно витрачати набагато більше ресурсів — часу, грошей та роботи штучного інтелекту. Тому легше використовувати знайомі нам патерни, які збирають cookies.

Наприклад, ми постимо фото з нашим песиком — його лайкають інші “собачники”, ви підписані на різні акаунти про собак, затримуєтесь на рілзах із собаками тощо. Не дивно, що в таргеті на вас постійно чекатиме корм, повідці та нашийники. Проте є тонші налаштування, де ШІ постійно висуває гіпотезу щодо вас — припускає, що якщо людина гуляє із собакою, то, можливо, їй треба нові кросівки, пляшка для води, вітрівка тощо. І ось одного дня ви натискаєте на рекламу з пляшкою для води, і вуаля — система фіксує коефіцієнт того, що умовна людина певної вікової групи, яка має собаку, з “ось такою” імовірністю перейде на сайт із пляшками і з “ось такою” ймовірністю купить її. 

Уявіть тепер, що таких коефіцієнтів про вас тисячі. Вони формуються на базі всього того, про що ми говорили раніше: ваших лайків, IP-адрес, місцезнаходжень, кліків, зосереджень на сайті й особливо ваших соціальних перетинів. Що більше коефіцієнтів, то кращі припущення й передбачення про вашу поведінку можна прогнозувати.

Проте, якщо вас хвилює саме прослуховування, то найкращою порадою тут буде вимкнення голосових асистентів і заборона на використання мікрофона в тих додатках, які цього не потребують.

Чи становлять небезпеку TikTok, Telegram та Viber?

Із цієї трійці потенційно найбільшу загрозу для використання даних може становити TikTok. Оскільки це додаток, що почасти належить китайській компанії Bytedance, а згідно з китайським законом від 2017 року місцеві компанії повинні передавати державі персональні дані користувачів, якщо вони мають стосунок до національної безпеки.

У 2022 році Сенат США проголосував за заборону використання TikTok на всіх державних пристроях і телефонах — це рішення ухвалили в межах законопроєкту, який блокуватиме всі соцмережі, пов’язані з недружніми до США країнами. Штат Монтана взагалі заборонив завантажувати TikTok усім громадянам з 2024 року.

Заборона на використання TikTok держслужбовцями на робочих пристроях також поширилася в Австралії, Новій Зеландії, Канаді, Британії, Нідерландах, Бельгії, Норвегії. Відповідне рішення ухвалила Європейська Комісія та Європейська Рада, а у Швеції соцмережею заборонили користуватися навіть військовим. Та чи варто перейматися через TikTok звичайним громадянам? Я вважаю, що ні. Ми — маленькі гвинтики, які не мають глобального впливу на той масив даних, що обробляють соцмережі. Варто завжди памʼятати про правила цифрової гігієнти, думати про особисту безпеку та безпеку близьких. Але якщо ви не належите до співробітників державного сектору — навряд ви будете цікаві TikTok для чогось більшого, ніж таргетинг.

Signal, Whatsapp та Viber — це додатки, що використовують технологію peer-to-peer, відповідно шифрують чат або дзвінок безпосередньо між співрозмовниками. Тобто інформація не потрапляє на сервер і не може бути збереженою на ньому. Час від часу в мережі зʼявляються нові розмови, а іноді навіть фейки про те, що ці додатки потрібно терміново видаляти.

У будь-якому додатку у вас повинна бути подвійна автентифікація, різні нікнейми та фото в соціалках, резервна пошта для відновлення, складні паролі, які на пристроях потрібно зберігати під ще одним паролем і ніколи не використовувати один пароль для всіх соцмереж. Вони повинні завжди відрізнятися, тому в злитих паролях і є найбільша небезпека соцмереж.

Часто навіть видалення самого профілю в соцмережі може бути недостатньо. Оскільки дані про нас збираються й з інших сайтів, на яких ми щось купуємо, переглядаємо, читаємо тощо. Звісно, можна спробувати дауншифтинг, проте сучасний соціум настільки сильно сформований навколо мережі, що, ймовірно, це викличе більше незручностей, ніж переваг.

Додатково є сервіси, які збирають дані із соцмереж і фактично є повними їх дублями. Наприклад, у LinkedIn це ZoomInfo, у Вконтакте це Вквотч та Бігбукінгнейм. Тобто навіть якщо ви вже давно видалили свою сторінку з Вконтакте — дані з вашої сторінки, з великою ймовірністю, і досі залишаються в мережі. Або ж якщо ви видалили або підкорегували свої дані на Linkedin, то всі ці зміни можна буде побачити у сервісі Ікс-рей контакт. Окрім цього, є архіватори інтернету, такі як Веб-архів чи Архів-тудей, в яких можна архівувати будь-яку сторінку сайту в той чи інший момент часу. Тобто це не перебільшення, коли кажуть, що те, що потрапило в інтернет, там і залишається.

Тому найкращою порадою, крім чистки cookies та використання VPN буде побажання бути свідомими і думати наперед про те, як та навіщо ви використовуєте соцмережі.

Інші статті за темами
Підписатися
Підпишись на нашу розсилку і будь в курсі всіх оновлень
Підпишись на нашу розсилку і будь в курсі всіх оновлень