12 часов, 5 специалистов и 0 шансов на ошибку: каким образом собирается футбольная статистика?


Это весьма интересный процесс

12 часов, 5 специалистов и 0 шансов на ошибку: каким образом собирается футбольная статистика?

Getty Images

Назар Черковский Автор UA-Футбол

"Сила любого клуба определяется уровнем качества данных, которыми он владеет".

Так любят говорить представители известных компаний, занимающихся сбором футбольной статистики, которая позволяет простым болельщикам немного глубже погрузиться в контекст того или иного противостояния. Просматривая послематчевые отчёты, мы уже привыкли видеть там такой популярный показатель как ожидаемые голы (xG), мы привыкли видеть там показатель PPDA, мы привыкли к продвинутой футбольной статистике и простым количеством ударов по воротам или ударов в створ нас уже не удивишь. И хотя показатель ожидаемых голов точно не всегда отражает реальное соотношение вклада каждой из команд в отдельном матче, мы невольно обращаем на него внимание и если он подтверждает наше общее впечатление, то не использовать его как финальный аргумент просто невозможно.

Буквально 5 лет назад подобное было трудно себе представить, но на рынке появились такие статистические гиганты как Opta, StatsBomb, Deltatre, Squawka и они изменили наш способ анализа футбольных матчей. Opta и StatsBomb были одними из первых, кто начал сотрудничать с футбольными агентствами и профессиональными клубами, предоставляя им подробные отчеты по каждому матчу на регулярной основе. И именно на примере этих двух компаний мы попробуем разобраться, как вообще выглядит процесс сбора футбольной статистики, которую мы все так любим анализировать.

Opta имеет сразу несколько офисов по всему миру, ведь в компании считают, что местные футбольные аналитики лучше ориентируются в футбольных клубах своей страны, поэтому сбор данных проходит не централизованно. Однако любой отчёт должен пройти контроль качества через центральный офис, из которого всё и направляется к конечному потребителю (клубу, агентству или простому болельщику, который скролит ленту Twitter).

12 часов, 5 специалистов и 0 шансов на ошибку: каким образом собирается футбольная статистика? - изображение 1

Сам процесс сбора обеспечивается усилиями нескольких человек в сотрудничестве с компьютером, который значительно ускоряет процесс. Компьютер собирает и фиксирует общие данные: удары, пасы, отборы и тому подобное. Он обозначает на схеме поля где именно состоялось то или иное событие. Человек, который работает сборщиком данных, лишь проверяет эту информацию и корректирует её при необходимости.

В StatsBomb заявляют, что точность их данных составляет около 99% и это очень высокий показатель, которого удаётся достигать благодаря тандему человека и компьютера. Всё это касается обычных матчей, статистика которых не требует глубокого погружения. А вот если клуб-партнёр просит предоставить детальный отчёт по игре, то за дело берутся сразу два сборщика данных, каждый из которых отвечает за свою команду и у них есть 12 часов, чтобы полностью разобрать матч.

Два сборщика создают собственные отчёты и по итогу собранной информации компьютер начинает проверять данные на соответствие. Если в одном отчёте есть информация о выигранной верховой дуэли, то в другом должна быть информация о проигранной верховой и тому подобное. Если компьютер находит несоответствие, то оба сборщика повторно садятся и исследуют отдельные моменты.

После этого начинается процесс создания карт, на которых выделяют места, где произошли те или иные события во время игры. Именно на этом этапе начинается вычисление показателя ожидаемых голов (xG). Сборщики обозначают позицию каждого участника матча во время удара по воротам, они смотрят, где находится каждый из защитников, какая позиция у вратаря, насколько трудно было нанести удар атакующему футболисту. Также учитывают то, какой частью тела был нанесён удар, в какую зону створа ворот полетел мяч (если удар вообще был в створ). Не менее важна и высота, на которой находится снаряд во время удара, ведь удар головой никогда не будет столь же опасным, как удар ногой прямо с газона. Учитывая всю вышеупомянутую информацию, сборщики дают каждому удару свою оценку, то есть показатель ожидаемого гола.

После создания всех карт, сборщики данных объединяют эту информацию в отдельный файл, который отправляется в центральный офис. Если центральный офис подтверждает соответствие, то клубы или агентства получают свой отчет, а мы с вами получаем самые интересные статистические детали, которые впоследствии публикуются во всех известных социальных сетях.

И если вы подумали, что собирать футбольные данные по конкретному алгоритму — это очень тяжелая работа, которая требует невероятного уровня внимания, то вы правы, однако сами сборщики данных отмечают, что самое трудное — это идентифицировать игрока, из-за чего им частенько приходится обращать внимание на причёски или цвет бутс. Конечно, это касается скорее матчей между малоизвестными коллективами, но и во время матчей европейских грандов могут возникать проблемы. Аналитики из Opta жалуются на французский футбольный клуб "Нант", который играет в жёлтой форме с зелёными номерами на спинах, это очень затрудняет распознавание футболистов. Также сборщики данных не любят работать с матчами "Лидса" на "Элланд Роуд" под утренним солнцем, ни одна профессиональная камера не поможет им чётко увидеть и распознать игроков. И даже черно-белые полосы на форме "Ньюкасла" точно не облегчают жизнь аналитикам.

12 часов, 5 специалистов и 0 шансов на ошибку: каким образом собирается футбольная статистика? - изображение 2

Во время важных событий в реальном времени над одним матчем работают сразу 5 специалистов: рецензент, который проверяет, все ли правильно написано, один человек, собирающий все основные данные о событиях, двое, чтобы обозначать игроков и локацию на поле, где произошло то или иное событие, а также дополнительный человек, вручную заполняющий информацию о каждом отдельном моменте. И всё это в итоге дополняется и проверяется компьютером. Всё ради точности и ради конечного клиента.

Статистические компании не скрывают того, что главным источником мотивации их работы является сотрудничество с футбольными клубами, которым они продают данные. Причём клубы покупают не только отчёты о собственных матчах, иногда они заказывают отчёты о поединках низших лиг и используют это как инструмент скаутинга.

Соучредитель и руководитель отдела обработки данных в StatsBomb Хешам Абозекри говорит: "Очень часто именно наши отчёты помогают определить качественного игрока на очень раннем этапе его карьеры. И хоть Европа является конечным пунктом и мечтой для каждого футболиста, многообещающие таланты есть по всему миру. Вот почему сбор данных для низших лиг имеет решающее значение, ведь мы помогаем найти бриллиант даже там, где не самый красивый угол наклона трансляционной камеры, а стадионы не оснащены новейшими технологиями. Пример, который сразу приходит на ум — это Каору Митома. Два года назад "Брайтон" подписал его с "Кавасаки Фронтале" в Японии".

Конечно, футбольные клубы не могут ориентироваться только на отдельные статистические отчёты того или иного игрока, однако это помогает им заметить потенциальную будущую звезду, которую позже начинают детально изучать скауты.

Вот таким образом статистика выходит за пределы обычной аналитики матчей и именно так интересные показатели доходят и до нас с вами, простых болельщиков, которые нередко хотят найти цифровое подтверждение своим словам при очередном горячем футбольном споре. Как ни странно, но далеко не вся статистика собирается автоматически и даже в этой сфере, которая не терпит ошибок, многое зависит от человека.

Фото - Getty Images

Оцените этот материал:
Комментарии
Войдите, чтобы оставлять комментарии. Войти

Новости Футбола

Лучшие букмекеры

Букмекер
Бонус