У коді рекомендаційного алгоритму Twitter є докази упередженого ставлення до дописів про українську війну
Обіцянка Ілона Маска розкрити код рекомендаційного алгоритму Twitter була реалізована наприкінці минулого тижня. Представлені дані не лише показали вибіркове ставлення сервісу до дописів знаменитостей загалом і самого Ілона Маска зокрема. Оприлюднені дані стали першим доказом того, що найбільші світові соціальні платформи не зацікавлені в розповсюдженні інформації про війну в Україні.
Відкриті рекомендації від Twitter
Компанія Twitter опублікувала на GitHub два репозиторії , що містять код для багатьох блоків, які забезпечують роботу соціальної мережі. В першу чергу було оприлюднено код інструментів, які Twitter використовує для видимості дописів. Компанія назвала це рішення «першим кроком до більшої прозорості» і водночас «запобіганням ризику» для самого Twitter і людей на платформі.
Коментуючи цей крок, Ілон Маск уточнив: «Наш початковий анонс так званого алгоритму буде доволі незручним. Люди в ньому знайдуть багато помилок, але ми збираємося їх виправити дуже швидко. Навіть якщо ви з чимось не згодні, принаймні ви знатимете, чому це працює саме так, і що вами не маніпулюють таємно… Аналог, до якого ми прагнемо - це Linux, операційна система з відкритим вихідним кодом».
«Із оприлюдненого блоку було виключено будь-який код, який ставив би під загрозу безпеку та конфіденційність користувачів або здатність захистити нашу платформу від зловмисників, у тому числі підриваючи наші зусилля по боротьбі з сексуальною експлуатацією та маніпулюванням дітьми», — сказано в коментарі компанії.
Оприлюднений рекомендаційний алгоритм складається з кількох моделей, у тому числі моделі для виявлення небезпечного або образливого вмісту, визначення ймовірності взаємодії користувача Twitter з іншим користувачем і розрахунку «репутації» користувача Twitter. Декілька нейронних мереж відповідають за ранжування твітів і рекомендації облікових записів для підписки.
Персоналізація та рекомендація
Інженери Twitter пояснили, що рекомендаційний алгоритм запускається приблизно п’ять мільярдів разів на день: «Ми намагаємося витягнути найкращі 1500 твітів із сотень мільйонів… Сьогодні сторінка For You складається в середньому на 50% з твітів від людей, на яких ви не підписалися та 50% твітів від людей, за якими ви стежити, хоча це співвідношення може відрізнятися від користувача до користувача», – пояснюють у Twitter. «Рейнжування [твітів] досягається за допомогою нейронної мережі, що має понад 48 млн параметрів, яка постійно навчається взаємодії з твітами для оптимізації для позитивної взаємодії (наприклад, лайки, ретвіти та відповіді)».
Звичайно, користувачі Twitter не бачать повних 1500 твітів. Вони фільтруються відповідно до обмежень щодо вмісту та інших критеріїв і факторів, які враховуються моделями, наприклад, чи мають твіти «негативні відгуки», чи вони в основному від того самого користувача Twitter або від користувачів, які були заблоковані чи вимкнені.
Twitter-привілеї
Деякі видання та експерти, які змогли вивчити рекомендаційний код, підкреслили, що знайшли в ньому список VIP-персон, акаунти яких опрацьовуються по-іншому, не у відповідності зі стандартним алгоритмом. Найцікавішою знахідкою стало те, що алгоритм Twitter конкретно позначає, чи є автором твіту Ілон Маск, і має інші позначки, які вказують, чи є автор «досвідченим користувачем», а також чи є він республіканцем чи демократом.
Іншими словами, Twitter спеціально відстежує ефективність твітів Маска, і це зафіксовано прямо в алгоритмі Twitter.
Хоча Маск стверджує, що не знав про цю частину алгоритму відстеження показників його профіля, він раніше визнавав, що Twitter переглядав аналітику його облікового запису. Відомо, що Ілон Маск навіть скликав спеціальну нараду, мета якої полягала у покращенні видимості його власних дописів на платформі. Це відбулося після того, як твіт президента Джо Байдена під час Суперкубку став популярнішим, ніж твіт самого Маска про гру.
Коли запрошений спікер при обговоренні оприлюдленого коду на платформі Twitter Space поділився своїми занепокоєннями щодо групування облікових записів у категорії «демократ» і «республіканець», один із розробників Twitter пояснив, що цей код призначений лише для збору статистики. Однак у примітці до вихідного коду алгоритму зазначено, що збір показників використовувався, щоб гарантувати, що зміни в Twitter не вплинули негативно на жодну з цих чотирьох груп.
Twitter і Україна: запрограмовані упередження
Найцікавішим для українців була інша інформація, пов’язана із оприлюдненням коду рекомендаційних алгоритмів Twitter.
Якщо до цього часу ми могли лише підозрювати, що дописи, які стосуються війни в Україні, не особливо цікаві соціальним платформам і песимізуються ними при застосуванні алгоритмів відбору контенту, то зараз ми отримали докази того, що ці підозри не були безпідставними.
Останнім часом багато користувачів відзначили, що твіти, що стосуються України, з'являються не так часто в стрічці Twitter. Саме це відображено і в коді рекомендаційного алгоритму. Ми можемо лише припускати, що ситуація змінилася, відколи Ілон Маск очолив платформу, бо раніше такі дані не оприлюднювалися.
Ймовірно, контраверсійні та почасти й відверто дилетантські погляди Ілона Маска на війну в Україні відобразилися в рекомендаційному алгоритмі соціальної платформи, яка йому належить.
Правда, деталей стосовно того, які саме дописи про Україну песимізуються, наразі невідомо, бо детальніших пояснень чи коментарів від розробників в коді не було помічено. Сказано лише про зниження дописів, що стосуються «UkraineCrisisTopic».
Адже хоча Ілон Маск надав Україні супутникові термінали Starlink, він у своєму акаунті доволі часто висловлювався про цю війну, та навіть публікував «мирний план» для України, який передбачав народне волевиявлення та інші погляди, що сприяли позиції Росії.
Чому оприлюднення рекомендаційних алгоритмів – це важливий крок
Попри те, що оприлюднені дані – це великі фрагменти коду, які описують роботу надскладних нейронних мереж, що оперують величезною кількістю параметрів, сам факт того, що соціальна платформа розповіла про те, як працюють її рекомендації, є надзвичайно важливою подією на ринку соціальних мереж.
Оприлюднення рекомендаційних алгоритмів важливо, бо це сприяє збільшенню прозорості та відповідальності в роботі інтернет-платформ. Та й користувачі можуть зрозуміти, чому саме їх дописи стали видимими, або, навпаки, чому них знизилось охоплення.
Окрім того, це може допомогти зменшити вплив алгоритмів на формування інформаційної бульбашки – коли людина буде розуміти, чому саме їй показують той чи інший контент.
Інше питання, відповіді на яке поки немає – якими будуть наступні дії платформи після публікації цих рекомендацій і чи будуть якось ці алгоритми регулюватися з боку державних регуляторів.