Piłkomatyka

Tekst
0
Recenzje
Przeczytaj fragment
Oznacz jako przeczytane
Jak czytać książkę po zakupie
Czcionka:Mniejsze АаWiększe Aa

Część I

Na boisku

Rozdział 1

Nigdy niczego nie przewiduję i nigdy nie będę

„Nigdy niczego nie przewiduję i nigdy nie będę” – powiedział kiedyś pomocnik reprezentacji Anglii Paul Gascoigne. To oświadczenie jest, moim zdaniem, równie genialne, jak jego gol w meczu przeciwko Szkocji na Euro 1996. W ośmiu słowach udowodnił, że przewidywania są nieuniknione – w czterech pierwszych Gascoigne mylił się co do przeszłości i teraźniejszości, zaś w następnych czterech również co do przyszłości. Lecz mimo że tak bardzo się pomylił, Gazza powiedział nam coś ważnego. Streścił przecież głęboką prawdę o życiu – wszędzie można odnaleźć wzory. W tym, jak długo zajmuje nam dotarcie do pracy w porannych godzinach szczytu, w naszych kręgach znajomych i w tym, jak często się z nimi spotykamy. W tym, co jemy wieczorem na kolację i co kupujemy w supermarkecie. Oczywiście istnieją też wzory w futbolu. Wyzwaniem jest ich znalezienie i zrozumienie. Gdy je poznamy, możemy zacząć przewidywać.

Losowe piłkarzyki

Świetnie pamiętam, że moja fascynacja wzorami zaczęła się od wielkiej pomarańczowej księgi pełnej piłkarskich statystyk, którą dostałem pod choinkę, gdy miałem osiem lat. Przesiadywałem godzinami, przeglądając strony pełne liczb. Uwielbiałem tabele z nazwami drużyn w górnym wierszu i pierwszej kolumnie, w których wpisano wyniki meczów rozegranych pomiędzy nimi w danym sezonie. Sprawdzałem je kolumnami, sumując wszystkie gole i szukając spotkań z dziwnymi wynikami. Moim ulubionym było 4 : 3, ale dobrze brzmiało też 5 : 2. Obecnie nie mam aż tyle czasu na czytanie piłkarskich almanachów, ale na szczęście znalezienie wszystkich wyników i tabel w Internecie zajmuje tylko kilka sekund. Jeśli się to zrobi, można odczuć nieprzewidywalność, o której mówił Gascoigne. Sezon 2012/2013 w Premier League był świetny – mieliśmy sporo dość emocjonujących spotkań i niespodziewanych rezultatów. Liverpool dwukrotnie wygrał 5 : 0, a raz 6 : 0, a jednak nie zdołał zakwalifikować się do europejskich pucharów. Rozgrywki zwieńczyło przejście na emeryturę sir Alexa Fergusona, króla niespodziewanych zwrotów akcji w ostatniej chwili. Jego ostatni mecz jako trenera Manchesteru United nie był wyjątkiem – remis 5 : 5 z drużyną West Bromwich Albion, która trzy bramki strzeliła w ostatnich dziesięciu minutach. „Futbol, cholera jasna!”, jak to ujął niegdyś sir Alex.

Takie wyniki to cudowne wyjątki, najbardziej pamiętne mecze w sezonie. Było też sporo nudnych bezbramkowych remisów, zapomnianych być może przez kibiców, ale nie w statystykach rozgrywek. Jeśli jednak chcemy poznać ukryty wzór, musimy włączyć do naszych analiz również te remisy. Rysunek 1.1 to histogram liczby goli strzelonych we wszystkich meczach Premier League w sezonie 2012/2013. Średnia goli na mecz wyniosła trochę mniej niż 3, a dokładnie 2,79.

Histogram ten pokazuje, jak często zdarzały się określone wyniki łączne. Mieliśmy łącznie 35 bezbramkowych remisów, co obrazuje pierwszy od lewej słupek histogramu. Ostatni mecz sir Alexa był w tamtym sezonie jednym z dwóch, które zakończyły się strzeleniem 10 goli, co widać po prawej stronie wykresu. W środku histogramu znajdziemy najczęstszy rezultat łączny – 3 bramki, w większości tych meczów wynik końcowy brzmiał 2 : 1. Wzór zaczyna się już wyłaniać. Następny krok polega na sprawdzeniu, czy możemy zrozumieć, skąd ten wzór pochodzi, a do tego potrzebujemy modelu matematycznego.


Rysunek 1.1. Histogram liczby goli strzelonych w sezonie 2012/2013 angielskiej Premier League

Interesuję się modelowaniem matematycznym niemal tak długo, jak statystyką. W czasach gdy czytałem wielki pomarańczowy almanach piłkarski, moim drugim wielkim hobby była gra w piłkarzyki[1][5*]. Z moim przyjacielem Davidem Patersonem założyliśmy ligę piłkarzyków. Graliśmy każdego dnia po szkole, pięć lub sześć meczów przed kolacją, i zapisywaliśmy każdy wynik. Nigdy jednak nie udało nam się rozegrać wszystkich 380 spotkań przewidzianych w ligowym kalendarzu (20 drużyn, z których każda rozgrywa 19 meczów u siebie, co razem daje 20 × 19 = 380 meczów). Dni były po prostu za krótkie.

Ograniczani przez rodziców, którzy zdawali się myśleć, że powinniśmy czasem jeść i spać, Patzi i ja musieliśmy znaleźć inny sposób na dokończenie ligi. Rozwiązaniem były kostki do gry. Patzi rzucał jedną kostką dla swojego zespołu, a ja dla swojego. Potem odejmowaliśmy jeden od wyniku na każdej kostce, otrzymując rezultat meczu. Jeśli zatem Arsenal grał z Manchesterem City, Patzi toczył kostkę czerwoną, a ja niebieską. Jeśli na czerwonej wypadło pięć, a na niebieskiej trzy, to Arsenal zwyciężał 4 : 2. Model ten może generować spotkania, w których pada od 0 do 10 bramek, zupełnie jak na naszym histogramie Premier League.

Po wielu rzutach kostkami, i pewnych drobnych korektach na rzecz naszych ulubionych klubów, podliczaliśmy wyniki oparte na pojawiających się liczbach. Tworzyliśmy tabelę ligową, wpisując wszystko porządnie do zeszytu w linie. Myślę, że moim przeznaczeniem zawsze było zostać matematykiem. Ten drugi David jest dziś wziętym finansistą.

Rzucanie kostkami jest bardzo prostym przykładem modelu matematycznego, pojawia się tutaj jednak kilka problemów. W 2012 roku, tuż przed Bożym Narodzeniem, Chelsea rozbiła Aston Villę 8 : 0, co po prostu nie mogłoby się zdarzyć w naszym kostkowym modelu. Inny problem związany jest z tym, że w prawdziwym futbolu remisy 0 : 0 są bardzo częste. Dla kostek wynik 0 : 0 jest równie prawdopodobny, jak 5 : 5, zaś na histogramie 0 goli zdarza się niemal 20 razy częściej niż 10. Model nie działa. W przeciwieństwie do rzutów kostkami mecze piłkarskie nie są losowe.

Mecze są losowe, ale w inny sposób. To nieprzewidywalność czyni futbol i inne sporty zespołowe tak emocjonującymi. Jeśli oglądając mecz, odwrócisz wzrok na kilka sekund, możesz przegapić ważną akcję i nagłą bramkę. Dla osoby tworzącej modele jest to istotne spostrzeżenie. Prawdopodobieństwo strzelenia gola jest takie samo w każdej chwili gry. O ile istnieje wiele rodzajów czynników wpływających na częstotliwość, z jaką drużyny zdobywają bramki, o tyle dokładny czas padania goli jest mniej lub bardziej losowy.

Na podstawie tego założenia możemy przygotować symulację. Wyobraźmy sobie mecz piłkarski jako 90 jednominutowych okienek, a w każdym z nich gol jest równie prawdopodobny. Przy średniej wynoszącej 2,79 bramki na mecz prawdopodobieństwo strzelenia gola w dowolnym z tych okienek wynosi 2,79/90 = 0,031. Oznacza to, że szansa zobaczenia bramki w losowo wybranej minucie meczu to około 1 do 32. Nie jest ona zatem zbyt wielka, ale wystarczająca, by sprawić, że oglądamy uważnie.

Korzystając z tego modelu, możemy przeprowadzić symulację komputerową dla 90 minut, podczas których w każdej symulowanej minucie gol pada z prawdopodobieństwem równym 0,031. Jeśli przeprowadzimy tę symulację dla bardzo wielu meczów, dowiemy się, jak wygląda typowy sezon rozgrywek. Rysunek 1.2 przedstawia taki symulowany sezon jako linię ciągłą nałożoną na histogram prawdziwego sezonu 2012/2013 w Premier League.

Podobieństwo między modelem a rzeczywistością jest tu bardzo duże. Pamiętajmy, o jak złożonych sprawach mówimy. Wszystkie te krzyki trenera przy linii bocznej. Kibice usiłujący poderwać swoją drużynę do walki lub, częściej niż rzadziej, oznajmić jej, jaka jest beznadziejna. Myśli w głowach zawodników, gdy dociera do nich, że właśnie mają okazję strzelić gola. Żaden z tych czynników nie wydaje się wpływać na rozkład strzelonych bramek. Wręcz przeciwnie, to wszystkie te czynniki razem wzięte generują losowość w rodzaju tej założonej w modelu. Im więcej czynników uwzględnimy, tym większa losowość strzelania bramek i tym lepsze dopasowanie naszego symulowanego histogramu do rzeczywistości.


Rysunek 1.2. Histogram goli w sezonie 2012/2013 Premier League (słupki) zestawiony z rozkładem Poissona (linia ciągła)

Wygenerowana w mojej symulacji linia ciągła z rysunku 1.2 znana jest pod nazwą rozkładu Poissona. Ten typ rozkładu powstaje zawsze, gdy czas zajścia zdarzeń uprzednich nie ma wpływu na zdarzenia przyszłe. Właśnie to założyłem w swojej symulacji, i tak faktycznie dzieje się w futbolu – ani liczba strzelonych dotąd bramek, ani czas, który upłynął od pierwszego gwizdka, nie wpływają na prawdopodobieństwo strzelenia kolejnego gola. Uzyskany rozkład Poissona znakomicie radzi sobie z uchwyceniem ogólnego kształtu histogramu goli[2]. Zdarzenia danej minuty meczu piłkarskiego są nieprzewidywalne, stąd pojawia się ów rozkład. Wzór ten bierze się z czystej losowości.

Wybrałem rozgrywki Premier League nie dlatego, że z góry wiedziałem, iż pasują do modelu Poissona. Tak się po prostu złożyło, że interesuje mnie futbol. Mogłem wybrać właściwie dowolny sport, w którym gole lub punkty można zdobywać w każdej chwili. By się w tej kwestii upewnić, przyjrzałem się wynikom wszystkich meczów hokejowych NHL w sezonie 2012/2013. Średnia bramek na 60 minut podstawowego czasu gry wyniosła tu 5,2. Rysunek 1.3 przedstawia histogram liczby goli w 720 meczach składających się na sezon zasadniczy. Linia ciągła obrazuje odpowiedni rozkład Poissona.

Wyższa średnia liczby bramek powoduje przesunięcie wierzchołka histogramu na prawo, ale symulacja znów pasuje do danych. Dane i model niemal nie odbiegają od siebie, a drobne różnice dotyczące meczów z czterema bramkami można przypisać wahaniom zachodzącym z sezonu na sezon[3]. W hokeju gole padają częściej, ale ani nie mniej, ani nie bardziej losowo niż w piłce.

 

Rysunek 1.3. Histogram liczby goli strzelonych w sezonie 2012/2013 NHL (słupki) zestawiony z rozkładem Poissona (linia ciągła)

Końskie kopyto

Gdy zaczniemy myśleć w kategoriach symulacji losowych i rozkładu Poissona, będziemy je widzieć wszędzie. Na zajęciach z wprowadzenia do statystyki najlepszy (i jedyny) żart wykładowcy brzmi: autobusy przyjeżdżają zgodnie z rozkładem Poissona. Kierowca autobusu wyrusza zaopatrzony w harmonogram, ale po drodze natrafia na mnóstwo losowych czynników – starszy człowiek wsiada bardzo powoli albo rowerzysta jedzie środkiem buspasa. Innym klasycznym przykładem jest liczba żarówek, które musimy zmienić każdego roku w swoim domu. Za każdym razem, gdy włączamy światło, istnieje mała szansa, że żarówka się spali. Zsumujmy wszystkie straty, a otrzymamy rozkład Poissona.

Rozkład ten został nazwany na cześć Francuza Siméona Denisa Poissona, który opisał go jako pierwszy na początku XIX wieku. Kładł przy tym jednakże nacisk na stojące za rozkładem równania matematyczne, nie zaś na to, jak można go wykorzystać do modelowania rzeczywistości. W sposób, z którego korzystam tutaj, jako pierwszy rozkład Poissona zastosował w 1898 roku pracujący w Niemczech Polak – Władysław Bortkiewicz[4]. Badał on dwa zbiory danych. Jeden był bardzo makabrycznym zestawem statystyk, dotyczącym liczby samobójstw dzieci poniżej 10. roku życia w okresie 24 lat. Drugi znaleziony przez Bortkiewicza zbiór danych, tylko trochę mniej niepokojący, dotyczył żołnierzy, którzy zmarli w wyniku przypadkowego kopnięcia lub innego uderzenia przez konia. Bortkiewicz przyjrzał się 14 różnym regimentom do 20 lat wstecz i stworzył wykres liczby żołnierzy zabitych w ten sposób. Nie zdawał sobie, rzecz jasna, sprawy, że zaledwie kilka lat wcześniej założona została Angielska Liga Piłkarska[6*]. Mogłaby mu ona dostarczyć wszystkie potrzebne dane i nie musiałby zagłębiać się w niemieckie statystyki zgonów.

Bortkiewicz odkrył wysoką zgodność obu swoich zbiorów danych z rozkładem Poissona. Śmierć w wyniku kopnięcia przez konia była zjawiskiem rzadkim. W 144 na 280 analizowanych jednostek (14 regimentów razy 20 lat) nie zdarzyła się ani razu. Jednak w dwóch pechowych regimentach miały miejsce po cztery takie zgony w ciągu roku. Dopasowując rozkład Poissona, Bortkiewicz mógł pokazać, że w oddziałach tych wcale niekoniecznie gorzej traktowano konie – miały one w danym roku po prostu pecha. Piłka nożna jest lub nie jest ważniejsza niż sprawy życia i śmierci, ale rządzą w niej te same reguły.

Porównanie z rozkładem Poissona jest jedną z pierwszych rzeczy, jakie robię, otrzymując nowe dane. Czasami koledzy wchodzą do mojego gabinetu ze świeżo zebranymi wynikami badań i mówią na przykład: „To dziwne. Większość ryb nigdy nie przepływa obok drapieżnika, ale była jedna ryba, która zrobiła to cztery razy! Ma chyba śmiałą osobowość”. Trzy minuty później tworzę wykres rozkładu Poissona i nakładam go na dane kolegi. „Nie, twoja ryba nie była szczególnie śmiała” – odpowiadam. „To po prostu statystyczna konieczność”. Wielokrotne wpadnięcie na drapieżnika jest jak piłkarskie cięgi typu 0 : 5. Źle, jeśli się zdarza, ale może się zdarzyć każdemu.

Rozkład Poissona to nasz pierwszy przykład matematycznej analogii. Przydaje się w bardzo wielu kontekstach. Sprawdza się w przypadku meczów piłkarskich, spalonych żarówek i zgonów w wyniku kopnięcia przez konia. Rozkładu Poissona należy spodziewać się zawsze, gdy można rozsądnie przypuszczać, że coś może zdarzyć się niespodziewanie, w dowolnej chwili, niezależnie od tego, ile razy zdarzyło się wcześniej.

Większość współczesnych zastosowań rozkładu Poissona nie dotyczy futbolu, lecz kontynuuje tradycję zapoczątkowaną przez Bortkiewicza. Statystycy wydają się perwersyjnie fascynować śmiercią, obrażeniami i wypadkami. A może po prostu płacimy im za obliczenia dotyczące złych rzeczy, które mogą się nam zdarzyć, żebyśmy my sami nie musieli o nich myśleć. Jakikolwiek jest powód ich zainteresowania nieszczęściem, statystycy odnaleźli rozkład Poissona w wypadkach samochodowych, kolizjach ciężarówek, uszkodzeniach głowy, awariach silników samolotów, bankructwach, samobójstwach, morderstwach, wypadkach w miejscu pracy i na niebezpiecznych placach budowy[5]. Odnaleźli go nawet w liczbie wojen rozpoczętych pomiędzy 1480 a 1940 rokiem. A gdy już uporali się ze śmiercią i kalectwem, znaleźli rozkład Poissona w błędach drukarskich, wadach fabrycznych, awariach sieci, atakach wirusów komputerowych i rozwodach. Gdziekolwiek mamy do czynienia ze śmiercią lub zniszczeniem, nieszczęściem lub błędami, tam możemy znaleźć ten sam wzór losowości.

W 2015 roku matematyk Cristian Tomasetti i lekarz Bert Vogelstein użyli argumentu statystycznego, by pokazać, że dwie trzecie przypadków nowotworów powstaje w wyniku „pecha”[6]. Wprawdzie niektóre nowotwory można łączyć z trybem życia, na przykład nowotwór płuc z paleniem papierosów, ale to tylko część prawdy. Reszta, może istotniejsza, związana jest z nieuniknionymi podziałami komórek, które mają miejsce w naszych ciałach. Zawsze, gdy komórka się dzieli, istnieje bardzo mała szansa zajścia mutacji genetycznej, która może spowodować nowotwór. Cristian i Bert ustalili, że nowotwory częściej rozwijają się w tych częściach ciała, których komórki dzielą się szybciej, stwierdzili więc, że losowe mutacje stanowią zasadnicze wyjaśnienie nowotworów.

Analiza ta wywołała nieco kontrowersji. Jeśli nowotwory są po prostu losowe, to dlaczego mamy wydawać mnóstwo pieniędzy na badanie ich przyczyn? By uzasadnić użycie terminu „pech” i by lepiej wyjaśnić swoje wnioski, Cristian i Bert wykorzystali analogię z wypadkami samochodowymi. Jak twierdzą, im więcej czasu spędzamy, jeżdżąc autem, tym większe staje się prawdopodobieństwo wypadku. To, jak prowadzimy samochód, ma znaczenie, ale czas spędzany za kółkiem też jest ważny.

Analogia piłkarska nadaje się równie dobrze, jeśli nie trochę lepiej. Możemy potraktować każdy podział komórki w naszym ciele jako odpowiednik jednej minuty meczu. Gdy komórka się dzieli, istnieje (bardzo) maleńka szansa losowej mutacji nowotworowej, tak jak istnieje (znacznie większa) szansa straty bramki w trakcie meczu. To w tym sensie można myśleć o nowotworze jako o pechu. Czasem nasz zespół przetrwa mecz bez straty bramki, a my, miejmy nadzieję, przejdziemy przez życie bez choroby nowotworowej. I choć czasem przegrywamy, ponieważ przeciwnik był dobry, nikt nie może zaprzeczyć, że szczęście odgrywa istotną rolę w każdym konkretnym meczu. Nasze zdrowie jest jak sobotnie popołudnie na trybunach stadionu – nie wszystkim bramkom można zapobiec.

Nie wszystko, co nam się przytrafia, można sprowadzić do kwestii przypadku. Możemy zapobiec wielu chorobom, wybierając zdrowy styl życia, a przyczyną straty gola jest często błąd defensywy. Jednakże uświadomienie sobie, że wiele z tego, co nam się zdarza, to wypadki losowe, może nam czasem pomóc pogodzić się z trudnościami, które przynosi nam życie. Nie wszystko w życiu jest przewidywalne.

Mechanizm losowy

To nieprzewidywalność, mająca miejsce od pierwszej sekundy meczu piłkarskiego, tworzy rozkład Poissona po 90 minutach gry. Znamy średnią liczbę bramek na mecz, ale momenty ich padania są nieprzewidywalne. Wskutek tego niektóre wyniki stają się znacznie bardziej prawdopodobne niż inne. Paradoks polega na tym, że kwestię tę wyjaśnia mechanizm losowy. Fakt, że gole padają w czasie bardzo losowo, czyni wzór dla rezultatów przewidywalnym. Trudno przekonać swój umysł do tej myśli, ale to prawda. Sam fakt, że coś jest skrajnie losowe, często pomaga nam to coś wyjaśnić i przewidzieć, jak często się pojawi. Losowość umożliwia nam czynienie wszelkiego typu przewidywań co do przyszłości.

Matematycy stosują tę sztuczkę cały czas. Na początku nowego sezonu piłkarskiego, w trakcie eliminacji mundialu albo przy nominacjach do Oscarów gazety pełne są artykułów o „genialnych” matematykach, którzy przewidzieli prawdopodobieństwo zwycięstwa określonych drużyn lub filmów. Przewidywania te często wyglądają rozsądnie, a czasem są trafne. Ale skąd się one biorą?

Zdradzę wam sekret. Geniusze ci zwykle w prosty sposób wykorzystują rozkład Poissona, dodając nieco informacji o rywalizujących zespołach czy filmach. Jednym ze sposobów na modelowanie wyników piłkarskich jest obliczenie proporcji bramek strzelonych do straconych dla każdego zespołu i przeprowadzenie symulacji meczów pomiędzy nimi. Przykładowo w sezonie 2012/2013 Arsenal, grając u siebie, strzelał średnio 2,47 bramki na mecz, a na wyjeździe 1,32. Tracił zaś średnio 1,21 bramki u siebie i 0,74 na wyjeździe. Możemy zgromadzić takie statystyki dla wszystkich drużyn, a następnie przeprowadzić symulacje meczów pomiędzy każdą parą i otrzymać przewidywania na nadchodzący sezon. Przykład takich przewidywań podaje tabela 1.1, w której wykorzystałem dane z sezonu 2012/2013, by za pomocą modelu przewidzieć pierwszą czwórkę w sezonie 2013/2014[7].

Tabela 1.1. Pierwsza czwórka Premier League po pierwszej symulacji sezonu 2013/2014, opartej na proporcjach bramek z sezonu 2012/2013


Klub P W D L F A Pkt
Manchester City 38 22 7 9 71 42 73
Liverpool 38 22 5 11 64 43 71
Chelsea 38 21 5 12 74 51 68
Manchester United 38 19 7 12 61 45 64

P – liczba meczów, W – liczba zwycięstw, D – liczba remisów, L – liczba porażek, F – liczba strzelonych goli, A – liczba straconych goli

Przewidywania te nie są zbyt odległe od tego, co faktycznie się stało. W rzeczywistości Manchester City zdobył mistrzostwo, dwa punkty przed Liverpoolem, a drużyna Chelsea zajęła trzecie miejsce. Jest to jednak tylko jedna z wielu możliwych pierwszych czwórek, które pojawiały się w wyniku symulacji, gdy naciskałem klawisz „enter” na swojej klawiaturze. Za każdym razem, gdy uruchamiam symulację, każda drużyna spotyka się z wszystkimi innymi u siebie i na wyjeździe, wyniki są ustalane losowo z uwzględnieniem średnich proporcji bramek strzelonych i straconych, a ja sporządzam na ich podstawie tabelę ligową. Każda symulacja daje odmienne wyniki, czasami bardzo odmienne. Tabela 1.2 stanowi kolejny przykład.

Tabela 1.2. Pierwsza czwórka Premier League po drugiej symulacji sezonu 2013/2014, opartej na proporcjach bramek z sezonu 2012/2013


Klub P W D L F A Pkt
Liverpool 38 23 7 8 68 37 76
Chelsea 38 22 8 8 75 52 74
Manchester United 38 22 5 11 72 43 71
Manchester City 38 19 8 11 64 42 65

P – liczba meczów, W – liczba zwycięstw, D – liczba remisów, L – liczba porażek, F – liczba strzelonych goli, A – liczba straconych goli

 

Jako kibicowi Liverpoolu ta tabela podoba mi się znacznie bardziej! Przedstawia ona rzeczywistość alternatywną, w której Steven Gerrard nie potknął się w kluczowym meczu przeciwko Chelsea, więc Liverpool pomknął po swoje pierwsze od niemal 25 lat mistrzostwo. Gerrard być może wykorzystałby tę dobrą karmę, by wygrać dla Anglii mundial i zostałby sir Steviem G. Jest mnóstwo możliwych symulowanych rzeczywistości alternatywnych, więc równie dobrze mogę wybrać tę, która podoba mi się najbardziej.

Niestety obiektywny naukowiec z tyłu mojej głowy czuje, że musi podać pełne wyniki wszystkich symulacji. Rozegranie Premier League 10 tysięcy razy zajmuje na moim laptopie kilka minut i za każdym razem otrzymuję inny wynik. Jakkolwiek interesujące byłyby wszystkie te alternatywne rzeczywistości, osobno są nieistotne. Istotne jest podsumowanie tego, co się dzieje w ciągu tych 10 tysięcy razy. Jak często wygrywały ligę poszczególne drużyny? Po podsumowaniu dowiemy się, że Liverpool wygrał tylko w 11,5% symulacji. Manchester United, który zdobył tytuł w poprzednim sezonie, wygrał w 26,2% prób. Chelsea – w 19,2%, Arsenal – w 17,6%, Manchester City – w 12,8%, a Tottenham Hotspur – w 6%.

Z perspektywy czasu widzimy, że przewidywania te nie były najlepsze. Manchester United zmienił trenera i miał fatalny sezon. Dominowały, strzelając po ponad 100 bramek, zespoły Manchesteru City i Liverpoolu. Nie w tym jednak rzecz. Z pewnością nie zamierzam twierdzić, że stworzyłem już najlepszy model futbolu. Jesteśmy na razie na początku naszej opowieści i nie chciałbym ujawniać wszystkich moich sekretów modelowania już teraz.

Rzecz w tym, że ten oparty na losowości model, choć nie jest w pełni trafny, nie jest też całkowicie błędny. Zespoły przewidywane jako możliwi zwycięzcy ligi to te, którym zwykle idzie dobrze, a tabele zamieszczone wyżej wyglądają jak realistyczne rozstrzygnięcia sezonu, a w każdym razie niezbyt odmiennie od tych, których moglibyśmy się spodziewać. I otrzymaliśmy je właściwie bez wysiłku. Wykonaliśmy po prostu symulację, w której bramki padają losowo, przy czym każdy zespół ma inny wskaźnik ich zdobywania, a dostaliśmy rozsądnie wyglądającą pierwszą czwórkę sezonu. To niemal całkowite przeciwieństwo wizji nieprzewidywalnego futbolu roztoczonej przez Paula Gascoigne’a. Futbol jest bardzo przewidywalny. W każdy weekend w trakcie sezonu Premier League ponad 400 zawodników spędza 90 minut, biegając tam i z powrotem i kopiąc piłkę, a na koniec wygrywa duży klub z Londynu lub Manchesteru.

Przewidywanie oparte na losowości jest dzisiaj podstawowym sposobem używania matematyki w społeczeństwie. Gdy czekasz w kolejce na połączenie z biurem obsługi klienta, analityk zdążył już sprawdzić liczbę połączeń przychodzących i wyliczył, jak długo ludzie są skłonni się nie rozłączać. Gdy bank pożycza pieniądze drobnemu przedsiębiorcy lub nabywcy domu, ma już wyliczone prawdopodobieństwo bankructwa i, po zastosowaniu rozkładu Poissona, liczbę bankructw, z którymi będzie musiał sobie poradzić w nadchodzących latach.

Przewidywanie nie polega na stwierdzeniu, który konkretny klub wygra ligę, jak długo poczekasz na połączenie z infolinią, czy która firma zbankrutuje. Polega natomiast na wykorzystaniu częstotliwości zdarzeń przeszłych do obliczania prawdopodobieństw zdarzeń przyszłych. Wszystkie takie przewidywania wywodzą się z modelu matematycznego opracowanego pierwotnie dla liczby niemieckich żołnierzy kopniętych przez konie. Jeśli potrzebna jest analogia, możemy powiedzieć, że czekanie na bramkę dla Liverpoolu jest jak czekanie na autobus numer 19 w święto państwowe – godzinami nie jedzie nic, a potem dwa lub trzy przybywają w tym samym czasie. Analogia ta staje się użyteczna dzięki modelowaniu. Matematyka pozwala nam uchwycić wspólne właściwości przyjazdów autobusów, meczów piłkarskich, bankructw, zachorowań na nowotwory i rozmów telefonicznych. A potem pozwala nam przewidywać, z jaką częstotliwością to wszystko się zdarzy.

Prawda boiska

Nawet gdy bramki padają losowo, matematyka znajdzie sposób na przewidywanie. Gascoigne ma jednak rację. Prawdziwe piłkarskie opowieści nie mówią o losowości, mówią o wyrastaniu ponad losowość. Mówią o potknięciach i odrabianiu strat. Gdy w 2012 roku sir Alex Ferguson przeszedł na emeryturę, David Moyes poprowadził Manchester United do najgorszych wyników od ponad 20 lat – nie można tego wyjaśniać kumulacją pecha. Kiedy w 2014 roku w półfinale mundialu Niemcy rozbili Brazylię, strzelając 5 goli w 18 minut, nie był to tylko fragment losowej sekwencji bramek. Brazylijczycy nie wytrzymali presji, a Niemcy to wykorzystali.

Sukcesów sir Alexa i reprezentacji Niemiec nie można zrozumieć w kategoriach losowości – by je pojąć, musimy pomyśleć o ich ukrytych mechanizmach. Ironia polega tu na tym, że zdarzenia, które nie są losowe, są trudniejsze do zrozumienia, trudniejsze do przewidzenia, ale też dużo bardziej interesujące.

W mojej pracy naukowej to właśnie brak losowości stawia największe wyzwania. Mój kolega biolog wraca do mnie kilka tygodni później i mówi: „Gdy w pobliżu nie ma drapieżnika, ryby rozmieszczone są losowo, ale gdy zobaczą drapieżnika, tworzą zwartą, obrotową formację”. I teraz mamy prawdziwą zagadkę. Czy któraś ryba inicjuje powstanie tego młyna? Jak szybko obraca się młyn i czy określone ryby preferują określone pozycje? Dlaczego młyn to najlepszy sposób obrony przed drapieżnikiem? Pytania stają się interesujące, gdy model losowy zawodzi.

W kolejnych rozdziałach, gdy zagłębimy się w modelowanie, sprawy, którym będziemy się przyglądać, będą mniej losowe. Ruchy zawodników są ściśle zsynchronizowane, sieć podań ma swoją strukturę, piłka porusza się zgodnie z prawami fizyki, a trenerzy strategicznie myślą o taktyce. Modele, które poznamy, są bardzo różne, ale podstawa naszego podejścia będzie zawsze ta sama. Dokonujemy obserwacji, które dostarczają nam zestaw założeń. Przekształcamy te założenia na równania i sprawdzamy je, używając symulacji komputerowych i narzędzi matematycznych. Na koniec porównujemy własności modelu z rzeczywistymi danymi.

W matematyce stosowanej wyzwaniem jest wybranie modelu odpowiedniego do pytania, które nas interesuje. Jeśli chcemy tylko przewidzieć liczbę bramek w sezonie, to losowość często nam wystarczy. Jeżeli jednak chcemy zrozumieć ustawienia, ruch i umiejętności, to musimy pojąć strukturę. Osobiście nie przepadam za wyjaśnianiem wszystkiego przy pomocy mechanizmu losowego – chcę dowiedzieć się, o co naprawdę chodzi. By tego dokonać, muszę podejść bliżej zawodników i uważnie przyjrzeć się temu, co robią. I właśnie to zaraz zrobimy.