Соціолінгвістичні експерименти з дядьком Ґуґлом

Наталія Гарасівка

Сьогодні з’являються не лише нові суспільні сфери, а й навіть нові виміри реальності, в нашому випадку йтиметься про інтернет-простір. Він, як й інші сфери, для повноцінного функціонування не може обійтися без мови. Беручи до уваги двомовність на території нашої країни, цікаво дослідити хто, де і для чого послуговується в інтернеті українською чи російською мовою, наскільки чутливим до мови є сам інтернет-простір.

Одним зі способів втілити таке дослідження є аналіз результатів, запропонованих щодо одного і того ж запиту, сформульованого українською і російською мовами, пошуковою системою Google. Щоб виконати поставлене завдання, у цьому есе намагатимусь відповісти на два запитання: «Якою мовою говорить інтернет-спільнота міста?» та «Як пошукова система Google ідентифікує туристів та місцевих через мову запиту?»

Якою мовою говорить інтернет-спільнота міста?

Щоб дізнатися, яка мова переважає в інтернет-просторі міста, достатньо поставити Гуглу питання, які стосуються побутової сфери життя містян. Наприклад, на таке актуальне в теплий червневий час питання: «Де біля Києва можна назбирати суниць?»,  пошуковик знаходить у відповідь переважно статті з інтернет-видань про те як вирощувати суниці «розміром з яблуко» і скільки можна заробити на їхньому продажі, але ні слова про ті самі таємничі місця, де ці суниці ростуть. Якщо ж запитати: «Где под Киевом растет земляника», Google на першій же сторінці пошуку подає шість різних форумів, на яких містяни обговорюють багаті і не дуже суничні місця за 30-60 км від міста.

Таким чином, бачимо, що у Києві присутня активна російськомовна інтернет-спільнота, яка активно обмінюється досвідом та інформацією. В українськомовному інтернет-просторі переважають  газетні замітки, при цьому мережева взаємодія містян щодо побутових питань майже відсутня. (Звертаю увагу, що йдеться саме про побутові питання, а не про мобілізацію українськомовного інтернет-простору, коли йдеться, наприклад, про захист історичної спадщини міста).

Якщо говорити про Харків, то на запит «Де під Харковом можна посмажити шашлики»,  чотири з перших десяти відповідей говорять про заборону і штрафи за приготування їжі на відкритому вогні чи в мангалі на території міста, дві відповіді підказують місця для пікніків у Києві, а одна – навіть у Варшаві. Переформулювавши питання російською, отримуємо покликання на десять сайтів, які навперебій радять найкращі місця для відпочинку на природі й барбекю поблизу Харкова.

Легко помітити, що українська мова тут переважає як мова офіційного вертикального спілкування влади й громадян через засоби масової інформації, але для горизонтального спілкування жителі використовують винятково російську мову.

Звісно, активні українськомовні форуми теж існують. Територія їхнього поширення бігається з територією, де переважає українська мова. Одними з найпопулярніших є батьківські (чи як їх називають, «мамські») форуми, на яких користувачі обговорюють різноманітні питання, пов’язані з вихованням дітей. Так, на питання «Де в Тернополі відсвяткувати день народження?», більшість відповідей пошукової системи показують відгуки відвідувачів про місцеві заклади харчування і форуми обговорення цієї теми. Якщо ж запитати: «Где в тернополе отметить день рождения», з’являється реклама самих ресторанів та кафе, а також сайти з порадами для туристів.

Як пошукова система Google ідентифікує туристів та місцевих через мову запиту?

Для відповіді на це запитання я вирішила зробити кілька паралельних запитів українською та російською мовами  у найпопулярнішій в Україні пошуковій системі Google. Для початку я поцікавилась у пошуковика: «Куди піти в Києві?» Кількість результатів на цей запит дорівнює  298 000, з них на першій сторінці 8 українською і 2 російською. Всі надані пошуковою системою покликання спрямовують шукача на сторінки з афішами місцевих подій.  Кількість результатів на запит «Куда пойти в Киеве» складає 5 010 000, з них на першій сторінці подано 10 покликань російською, всі вони теж розповідають про афішу міста для місцевих (куди піти на вихідні).

Оскільки пошукових результатів про Київ українською в 16,6 раза менше, сам собою напрошується висновок про те, що інформація про розваги та цікаві події в Києві поширюють переважно російською. При цьому, запит як українською, так і російською перш за все показує новини для місцевих мешканців, а не інформацію для туристів. Тобто, у випадку Києва Google приймає «за своїх» і українськомовних і російськомовних користувачів.

Для прояснення картини з відрізненням жителів міста від туристів і кращої інтерпретації результатів, я проробила ті ж дії з пошуком інформації про Львів та Харків. На запит «Куди піти у Львові» Google запропонував 2 330 000 результатів, на першій сторінці було подано десять українськомовних покликань, п’ять з них описувало туристичні маршрути, решта п’ять – оголошення про місцеві події, місця для прогулянок та розважальні заходи на вихідні. На питання «Куда пойти во Львове?» знайшлося 307 000 результатів, всі перших десять російськомовних відповідей давали інформацію про те, що варто обов’язково зробити й де побувати туристам. На те ж питання про Харків, поставлене українською мовою, всі десять перших відповідей були українською, з них сім пропонували розваги для туристів, три інші – міську афішу. Характерно, що та питання російською «Куда пойти в Харкове?», Google представив дев’ять варіантів сайтів з міською афішею, інформацією більш істотною для харків’ян, і один сайт з описом туристичних цікавинок.

Очевидним є те, що між мовою запиту, панівною мовою міста і співвідношенням запропонованих результатів для туристів та місцевих мешканців існує зв’язок. У Львові російськомовний запит є сприйнятий алгоритмом пошуку як винятково туристичний, українськомовний же (попри шалену туристичну популярність міста) – залишає 50% на те, що ви місцевий мешканець. У Харкові українська мова явно є мовою приїжджих, яким ймовірно більш цікаві певні міські атракції, а російська переважно є мовою місцевих мешканців.

Варто зазначити, що при пошуку російською мовою, Google окрім самих результатів пошуку показує ще і розгорнуте посилання на інтерактивну карту цікавих місць «Чим зайнятися» та дає стислу інформаційну довідку про місто. Обидві додаткові функції подані українською, хоча якщо з початку вводити запит українською, вони не з’являються.

Отже, мова міського інтернет-простору збігається з мовою, яка переважає у побутовому спілкуванні громадян. Звісно, такі результати є досить очікуваними, адже мережеву спільноту творять ті ж люди, які спілкуються на вулицях. Цікавим є те, що, виявляється, навіть за допомогою математичних алгоритмів безособовий механізм здатен за мовою запиту розрізнити місцевих жителів та приїжджих подорожніх. В мережі, як і в житті, більшість киян і переважна більшість харків’ян спілкуються російською, при цьому російськомовна київська спільнота є більш активною. За пошуковими запитами російською мовою про Львів чи Тернопіль, Google ідентифікує шукача як немісцевого і надає відповідну інформацію, гіпотетично цікаву для туристів. У Києві та Харкові найбільш активними є російськомовні форуми, у Львові та Тернополі – українськомовні.

Автор:  Наталія Гарасівка, студентка Національного університету  «Києво­Могилянська академія»