12 годин, 5 фахівців та 0 шансів на помилку: яким чином збирається футбольна статистика?


Це дуже навіть цікавий процес

12 годин, 5 фахівців та 0 шансів на помилку: яким чином збирається футбольна статистика?

Getty Images

Назар Черковський Автор UA-Футбол

"Сила будь-якого клубу визначається рівнем якості даних, якими він володіє".

Так люблять казати представники відомих компаній, що займаються збором футбольної статистики, яка дозволяє простим вболівальникам трохи глибше зануритись у контекст того чи іншого протистояння. Переглядаючи післяматчеві звіти, ми вже звикли бачити там такий популярний показник як очікувані голи (xG), ми звикли бачити там показник PPDA, ми звикли до просунутої футбольної статистики й простою кількістю ударів по воротах чи ударів у площину нас вже не здивуєш. І хоч показник очікуваних голів точно не завжди відображає реальне співвідношення вкладу кожної з команд в окремому матчі, ми мимовільно звертаємо на нього увагу і якщо він підтверджує наше загальне враження, то не використати його як фінальний аргумент просто неможливо.

Буквально 5 років тому подібне було важко собі уявити, але на ринку з’явились такі статистичні гіганти як Opta, StatsBomb, Deltatre, Squawka і вони змінили наш спосіб аналізу футбольних матчів. Opta та StatsBomb були одними з перших, хто почав співпрацювати з футбольними агентствами та професійними клубами, надаючи їм детальні звіти по кожному матчу на регулярній основі. І саме на прикладі цих двох компаній ми спробуємо розібратись, як взагалі виглядає процес збору футбольної статистики, яку ми всі так любимо аналізувати.

Opta має одразу кілька офісів по всьому світу, адже у компанії вважають, що місцеві футбольні аналітики краще орієнтуються у футбольних клубах своєї країни, тому збір даних проходить не централізовано. Однак будь-який звіт повинен пройти контроль якості через центральний офіс, з якого все і прямує до кінцевого споживача (клубу, агентства або простого вболівальника, який скролить стрічку Twitter).

12 годин, 5 фахівців та 0 шансів на помилку: яким чином збирається футбольна статистика? - изображение 1

Сам процес збору забезпечується зусиллями кількох людей у співпраці з комп’ютером, який значно пришвидшує процес. Комп’ютер збирає та фіксує загальні дані: удари, паси, відбори і тому подібне. Він позначає на схемі поля де саме відбулась та чи інша подія. Людина, яка працює збирачем даних, лиш перевіряє цю інформацію та коригує її за необхідності.

В StatsBomb заявляють, що точність їх даних складає близько 99% і це дуже високий показник, якого вдається досягати завдяки тандему людини і комп’ютера. Все це стосується звичайних матчів, статистика яких не вимагає глибокого занурення. А от якщо клуб-партнер просить надати детальний звіт по грі, то за справу беруться одразу два збирачі даних, кожен з яких відповідає за свою команду і у них є 12 годин, щоб повністю розібрати матч.

Два збирачі створюють власні звіти і за підсумком зібраної інформації комп’ютер починає перевіряти дані на відповідність. Якщо в одному звіті є інформація про виграну верхову дуель, то в іншому повинна бути інформація про програну верхову і тому подібне. Якщо комп’ютер знаходить невідповідність, то обидва збирачі повторно сідають та досліджують окремі моменти.

Після цього починається процес створення карт, на яких виділяють місця, де стались ті чи інші події під час гри. Саме на цьому етапі починається вираховування показника очікуваних голів (xG). Збирачі позначають позицію кожного учасника матчу під час удару по воротах, вони дивляться, де знаходиться кожен з захисників, яка позиція у воротаря, наскільки важко було завдати удару атакуючому футболісту. Також зважають на те, якою частиною тіла був завданий удар, в яку зону площини воріт полетів м’яч (якщо удар взагалі був у площину). Не менш важлива і висота, на якій знаходиться снаряд під час удару, адже удар головою ніколи не буде настільки ж небезпечним, як удар ногою прямо з газону. Враховуючи всю вищезазначену інформацію, збирачі дають кожному удару свою оцінку, тобто показник очікуваного голу.

Після створення всіх карт, збирачі даних об’єднують цю інформацію в окремий файл, який надсилається до центрального офісу. Якщо центральний офіс підтверджує відповідність, то клуби або агентства отримують свій звіт, а ми з вами отримуємо найцікавіші статистичні деталі, які згодом публікуються у всіх відомих соціальних мережах.

І якщо ви подумали, що збирати футбольні дані за конкретним алгоритмом — це дуже важка робота, яка вимагає неймовірного рівня уваги, то ви праві, однак самі збирачі даних зазначають, що найважче — це ідентифікувати гравця, через що їм частенько доводиться звертати увагу на зачіски або колір бутс. Звісно, це стосується скоріше матчів між маловідомими колективами, але і під час матчів європейських грандів можуть виникати проблеми. Аналітики з Opta скаржаться на французький футбольний клуб "Нант", який грає у жовтій формі із зеленими номерами на спинах, це дуже ускладнює розпізнавання футболістів. Також збирачі даних не люблять працювати з матчами "Лідса" на "Елланд Роуд" під ранковим сонцем, жодна професійна камера не допоможе їм чітко побачити та розпізнати гравців. Та навіть чорно-білі смуги на формі "Ньюкасла" точно не полегшують життя аналітикам.

12 годин, 5 фахівців та 0 шансів на помилку: яким чином збирається футбольна статистика? - изображение 2

Під час важливих подій у реальному часі над одним матчем працюють одразу 5 фахівців: рецензент, який перевіряє, чи все правильно написано, одна особа, що збирає всі основні дані про події, двоє, щоб позначати гравців і локацію на полі, де відбулась та чи інша подія, а також додаткова особа, що вручну заповнює інформацію про кожен окремий момент. І все це у підсумку доповнюється та перевіряється комп’ютером. Все заради точності та заради кінцевого клієнта.

Статистичні компанії не приховують того, що головним джерелом мотивації їх роботи є співпраця з футбольними клубами, яким вони продають дані. Причому клуби купують не лише звіти про власні матчі, інколи вони замовляють звіти про поєдинки нижчих ліг і використовують це як інструмент скаутингу.

Співзасновник і керівник відділу обробки даних у StatsBomb Хешам Абозекрі каже: "Дуже часто саме наші звіти допомагають визначити якісного гравця на дуже ранньому етапі його кар’єри. І хоч Європа є кінцевим пунктом та мрією для кожного футболіста, багатообіцяючі таланти є по всьому світу. Ось чому збір даних для нижчих ліг має вирішальне значення, адже ми допомагаємо знайти діамант навіть там, де не найкрасивіший кут нахилу трансляційної камери, а стадіони не оснащені новітніми технологіями. Приклад, який одразу спадає на думку — це Каору Мітома. Два роки тому "Брайтон" підписав його з "Кавасакі Фронтале" в Японії".

Звісно, футбольні клуби не можуть орієнтуватись тільки на окремі статистичні звіти того чи іншого гравця, однак це допомагає їм помітити потенційну майбутню зірку, яку пізніше починають детально вивчати скаути.

Ось таким чином статистика виходить за межі звичайної аналітики матчів і саме так найцікавіші показники доходять і до нас з вами, простих вболівальників, які нерідко хочуть знайти цифрове підтвердження своїм словам при черговій гарячій футбольній суперечці. Як не дивно, але далеко не вся статистика збирається автоматично і навіть у цій сфері, яка не терпить помилок, багато чого залежить від людини.

Фото - Getty Images

Оцініть цей матеріал:
Коментарі
Увійдіть, щоб залишати коментарі. Увійти

Новини Футболу

Найкращі букмекери

Букмекер
Бонус