Włodzimierz Holsztyński
Ranking - postulaty0. WSTĘP
W poprzedniej części z grubsza uzasadniłem ważność rankingowego systemu dla świata szachów, oraz jego biznesową wartość dla ewentualnych firm, zajmujących się prowadzeniem rankingu. Tym razem skupię się na cechach rankingu, które uczynią go pożądaną metodą porównywania siły szachistów.W szczególności podam metodę wystartowania systemu, oceny partii nowych uczestników oraz partii pomiedzy uczestnikami, z których jeden (lub obaj) był mało aktywny w okresie poprzedzającym partię. Mówię tu o rozwiązaniu w ramach jednego rankingu (jednej listy). Ogólna zasada jest następująca: bardziej się liczy porównanie jabłka z jabłkiem niż gruszki z grejfrutem. Ponadto, bardziej zasadniczo, trudność wypływająca z mieszania szachistów o różnym poziomie rozwiązuje się przez prowadzenie odrębnych list dla szachistów o coraz wyższym poziomie.
Znane są cykle wsród wybitnych szachistów, kiedy to szachista A ma świetne wyniki przeciwko B, też przeciwko C, a z kolei C przeciwko A. Oznacza to, że żaden ranking nie jest w stanie przewidzieć w każdym przypadku, który szachista wygra z którym. Na przykład ranking może ich uporządkowac A > B > C, ale wtedy będzie nas mylił w przypadku graczy A C. Istnieja też cykle z więcej niż trzech szachistów. Ranking będzie popełniał co najmniej jeden błąd przy każdym cyklu. (Może podam analizę zjawiska cykli, wraz z jej ramifikacjami dla komputerowych programów szachowych i nawet trenowania szachistów, ale już poza niniejszą serią artykułów).
Tak więc żaden pojedynczy ranking nie może być idealny. Dla każdej listy można na przykład prowadzić rankinig stabilny i ranking dynamiczny. Tym ważniejsza jest matematyczna prostota rankingu. Życie pokazuje też, że mimo wszelakich wątpliwości, ranking dla świata szachowego jest pożyteczny, wręcz niezbędny. Ba, gdy najsilniejsi szachiści globu tworzą cykl, to żaden nie może być absolutnym mistrzem świata, a mimo to z instytucji mistrza świata nie chcemy zrezygnować.
Uwaga: Być może mieliśmy niedawno cykl:
... > Kramnik > Topałow > Anand > Kramnik > ...
1. POSTULATY
Przejdźmy do rankingu. Zamiast o pojedynczej funkcji rankingowej myślę o całym systemie. Ale rozpatruję, nawet przy pojedynczym rankingu, dwie prezentacje tej samej w zasadzie funkcji. Jedna jest główna i multyplikatywna, a pochodna forma, z grubsza mówiąc, jest logarytmem formy głównej. Ta pomocnicza forma pochodna będzie tak dobrana, by przemiawiała do ludzi. W swoich rozważaniach, jeżeli inaczej nie zaznaczę, będę zawsze rozpatrywał formę główną (multyplikatywną).Poniższe postulaty formułuję dla wygody czytelników, a nie pod kątem maksymalnej, formalnej elegancji logicznej. Konkretną funkcję rankingową, spełniającą postulaty, podam w następnym artykule, wraz z matematyczną dyskusją.
POSTULAT A. Obecna, tym bardziej przyszła, technologia komputerowa jest w stanie śledzić choćby i dziesięć miliardów kont. Miejsce na dysku, rozmiar pamięci ani szybkość procesorów nie jest dziś żadnym ograniczeniem, wymuszającym kompromisy. Obliczenia i tabele wewnętrzne mogą i powinny używać maksymalną dostępną dokładność wyliczeń, która nie spowalnia systemu. Oficjalny ranking powinien być tę wewnętrzną liczbą, wyliczoną w ramach danej precyzji. Gdy, wraz z postępem technologii, dostępna szybka precyzja zwiększy się, to system będzie rankingi wyliczone z poprzednią precyzją kontynuował z nową (t.zn. do danej daty mamy rankingi ze starą precyzją, a odtąd będą modyfikowane z nową).
Komentarz: Może ktoś się żachnąc, że przecież nie ma znaczenia, czy kogoś ranking jest 2606, czy też 2599.9998 czy też 2606.008. Jednak wyższa precyzja nikomu nie szkodzi, a kontruje ekstra błędy, spowodowane iteracją. Ponadto, gdy organizator wybiera spośród dwóch graczy tego o wyższym rankingu, to ekstra dokładność jest pomocna. Szachowo tak nikłe różnice są bez znaczenia, ale w sporcie często wygrywają nikłe różnice. Są wynikiem łutu szczęścia, ale są czystą metodą podejmowania decyzji (jesteś na mecie, na dystansie 10km, w przedzie o 1cm, to wygrałeś, a drugi ma pecha - tak jest w porządku).
POSTULAT B. Każda wygrana partia przyniesie pewien dodatni zysk rankingowy wygranemu, i stratę przegranemu. W przypadku wielkiej przewagi rankingu wygranego nad przegranym, zysk i strata będą mikroskopijne, ale niezerowe. Zachęci to, choćby marginesowo, silnych graczy do poświęcenia czasu słabszym.
POSTULAT 0. Ranking każdego gracza, względem głównej funkcji multyplikatywnej, jest liczbą rzeczywistą, większą od zera.
POSTULAT 1. Zysk rankingowy wygranego jest równy stracie przegranego: suma rankingów dwóch graczy przed i po partii jest ta sama.
Komentarz: Wynika stąd, że grając z kimś, o rankingu bliskim zeru, wiele nie wygramy, bo tylko ułamek jego rankingu. Gdy mamy ranking 2000, a przeciwnik ma ranking tylko 10 (dziesięć), to nawet po długim i totalnie wygranym meczu nasz ranking będzie wciąż mniejszy niż 2010.
POSTULAT 2. Każde konto początkowo, na danej liście, ma ranking będący zawsze i dla wszystkich tę samą wartością początkową.
Komentarz (i): Wynika stąd, że średnia arytmetyczna rankingów wszystkich kont, w postaci głównej (multyplikatywnej), ma zawsze tę samą wartość. Pozwala to na porównywanie szachistów z różnych epok, bowiem ranking porównuje szachistę z rankingiem przeciętnym, który po wszystkie czasy bedzie ten sam. (Żadne porównanie nie jest idealne. W danym przypadku ranking wybitnego szachisty zależy nie tylko od jego zdolności, ale także od totalnej aktywności na liście. Im większa aktywność, tym większa możliwość dla naj-naj-najsilniejszych graczy wykazania się ich potencjałem).
Komentarz (ii): Gdy system dopiero powstaje, to niektórzy najsilniejsi gracze mogą nie chcieć zaczynać od średniego rankingu. Wtedy na danej liście nie będą. Wciąż mogą być na liście bardziej ekskluzywnej, na której wystartują z rankingiem przeciętnym dla tej ekskluzywnej listy. Gdy, przypadkowo lub nie, dostanie się na listę ekskluzywną gracz słabszy, to wielkiej szkody nie będzie, bo szybko zostanie na takiej liście zamrożony z powodu słabych wyników (ewentualnie zostanie odmrożony, gdy uzyska silne wyniki, na przykład odnotowane przez mniej ekskluzywną listę).
POSTULAT 3 (charakterystyczny). Multyplikatywność: niech A B C D będą rankingami czterech graczy, nazwijmy ich gA gB gC gD, dla których
A / B = C / D
przy czym relacje doświadczenia i aktywności graczy gA gB oraz graczy gC gD są równoważne (w szczególności identyczne). Pierwsi dwaj - gA przeciwko gB, i pozostali dwaj - gC przeciwko gD, rozegrali partię, przy czym w obu partiach padł taki sam wynik x:y. Wtedy dla nowych rankingów A' B' C' D' dalej zachodzi proporcja:
A' / B' = C' / D'
POSTULAT 4 (charakterystyczny). Krotko: gracz wygrywa punkty przeciwnika, a traci własne. Oznacza to, że czy to Iwańczuk wygra z Kasparowem, czy też patałach, to Iwańczuk i patałach zyskają tyle samo punktów - za równą pracę równa płaca. Natomiast gdy przegrają z Kasparowem, to Iwańczuk przegra wiele punktów, bo ma wysoki ranking, a patałach przegra tyle co nic. Z tym, że gdy fuszer wygra z Iwańczukiem i patałachem, to zyska dokładnie tyle samo punktów co Kasparow - niewiele za wygranie z patałachem i sporo za wygranie z Iwańczukiem. A teraz szczegółowy opis niniejszego postulatu:
Ranking opiera się na pewnej funkcji:
W(X y)
(gdzie X jest rankingiem gracza przed partia bieżącą o wyniku x : y, gdzie parameter y oznacza komponentę wyniku uzyskaną przez przeciwnika).
Niech a : b będzie wynikiem partii pomiędzy graczami o rankingach A B, gdzie a b są nieujemnymi liczbami rzeczywistymi, spełniającymi a+b = 1 (w szachach mamy tylko 3 możliwości: a=0 i b=1, lub a=b=1/2, lub a=1 i b=0). Niech A' B' będą rankingami tychże graczy po partii. Wtedy zachodzi:
A' - A = (W(B a) - W(A b)) <> w
B' - B = W(A b) - W(B a) <> w
gdzie waga w (0 < w <= 1) zależy od min(A/B B/A) oraz od różnicy stopnia aktywności graczy. Przy tym funkcja W spełnia warunki (aksjomaty):
(a) W(X 0) = 0
(b) 0 <= x < y <= 1 ==> W(X x) < W(X y)
(c) 0 < X < Y oraz x > 0 ==> W(X x) < W(Y x)
(d) W(X 1) < X
Komentarz (i): Na mocy (a) (b) (d) zachodzi: X > W(X x) >= 0, gdy 1 >= x >= 0.
Komentarz (ii): Widzimy, że wygrana jednego gracza jest przegraną drugiego, to znaczy:
(A' - A) + (B' - B) = 0
(Jest to zgodne z Postulatem 1).
Komentarz (iii): Zdobycz rankingowa W(B a) gracza o rankingu A, zgodnie z obietnicą, zależy wyłącznie od rankingu B jego przeciwnika, i od własnego sukcesu a w partii; nie zależy od własnego rankingu. Natomiast strata W(A b) tegoż gracza zależy wyłącznie od własnego ranking A, i w ogóle nie od rankingu przeciwnika. Tak więc przybytek rankingu (dodatni lub ujemny) zależy wyłącznie od rankingu przeciwnika, gdy partię się wygralo, oraz zależy wyłącznie od własnego rankingu gdy partię się przegralo.
POSTULAT 5. Waga w gry, gdzie 0 < w <= 1, jest wyższa, gdy gracze pod względem szachowym są podobni, i niższa gdy są w różnej sytuacji. Waga ma dwa czynniki: w = u <> v, będące współczynnikami podobieństwa: doświadczenia+aktywności oraz siły szachowej odpowiednio. Można te dwa wspólczynniki u v zdefiniować na przykład tak:
(u) Niech ? ß oznacza liczbę partii kiedykolwiek rozegranych przez dwóch graczy (przed partią bieżącą), i wziętych pod uwagę przez listę rankingową. Wprowadźmy pomocniczo
?' := 30 + min(? 100) oraz ß' := 30 + min(ß 100)
Niech m n będą liczbami rankingowych partii, rozegranych przez graczy w ciągu 100 dni poprzedzających partię bieżącą, oraz niech M N będą podobnymi liczbami odpowiedno dla tych samych graczy za okres 360 dni. Wprowadźmy parametry pomocnicze:
m' := 5 + min(m 20) oraz n' := 5 + min(n 20)
M' := 10 + min(M 40) oraz N' := 10 + min(N 40)
ponadto niech
s := ?'<>m'<>M' oraz t := ß'<>n'<>N'
teraz definiujemy:
u := 4? min( s/t t/s)
gdzie 4? oznacza pierwiastek stopnia czwartego (a nie cztery razy pierwiasteki kwadratowy)
(v) Niech, jak wyżej, A B będą rankingami graczy przed bieżącą partią.
Zdefiniujmy:
v := min(1 ? (3<>min(A B) / 2<>max(A B)))
(tym razem proponuję zwykły pierwiastek kwadratowy).
Komentarz (?): Według podanych powyżej przykładowo wzorów w punkcie (u), gracze, którzy rozegrali w życiu 100 lub więcej partii rankingowych, uważani są za w pełni doświadczonych, i już funkcja rankingu nie rozróżnia ich doświadczenia nawet gdy jeden zaliczył tylko 100 a drugi 30000 partii - czynnik doświadczenia:
4? min( ?'/ß' ß'/?' )
będzie 1 czyli wpływ - żaden. Maksymalnie różnica doświadczenia zmniejsza wagę partii, gdy jeden z graczy rozegrał 100+ rankingowych partii, a drugi 0; wynosi wtedy
4? (30/130) ? 0.6931
Zdawałoby się, że 0.7 jest niedostateczne, że powinno być mniejszym czynnikiem (ostrzejszym). Być może. Pamietajmy jednak, że dochodzą jeszcze czynniki aktywności, mianowicie za ostatnie 100 i za ostatnie 360 dni.
Komentarz (ß): Według wzorów (u), gracz, który rozegrał przed bieżącą partią co najmniej 20 rankingowych partii w poprzedzających 100 dniach uważany jest za w pełni aktywnego za ten okres czasu. Gdy dwóch takich graczy spotka się za szachownicą, to wpływ różnicy ich aktywnosci za 100 ostatnich dni bedzie żaden. Największy wpływ występuje, gdy jeden z graczy w ogóle nie grał w ciągu ostatnich 100 dni, a drugi co najmniej 20 partii, i czynnik zmniejszający wagę partii wynosi wtedy:
4?(5/25) ? 0.6687
Podobnie za w pełni aktywnych graczy za okres poprzedzających 360 dni uważa się tych, którzy w tym czasie rozegrali co najmniej 40 partii. Różnica w aktywności za ostatnie 360 dni w partiach pomiędzy nimi nie zmniejsza wagi partii. Maksymalnie zmniejsza wagę partii, gdy jeden w ogóle nie grał w ciągu ostatnich 360 dni, a drugi 40+ partii; czynnik zmniejszający wynosi wtedy tyle co w podobnym ekstremalnym przypadku dla 100 dni:
4?(10/50) ? 0.6687
Komentarz (?): Według wzorów (u), najostrzej na zmiejszenie wagi partii, z powodu różnicy doświadczenia i aktywnośći, wspólczynnik u występuje w przypadku nowicjusza i aktywnego, doświadczonego szachisty; wtedy wynosi:
4? ( 30<>5<>10 / (130<>25<>50) ) ? .31
Wygląda to może na zbyt łagodne zróżnicowanie pomiędzy graczami. Ale chyba nie. Pamiętajmy, że dochodzi także czynnik różnicy siły pomiędzy szachistami.
Komentarz (?): Według wzoru (v) partia pomiędzy graczami, dla których z grubsza spodziewamy się, że ich hipotetyczny mecz z 5 partii zakończy się wynikiem nie bardziej krańcowym niż 3:2 (albo 6:4 przy 10 partiach), będzia miała pełną wagę (gdy mają podobne doświadczenie i są podobnie aktywni). W przypadku najsilniejszych graczy globu i słabszych arcymistrzów można się spodziewać 6:1 wyniku. Wtedy ten jeden czynnik powoduje zmniejszenie się wagi ?2 ? 1.4 razy - to znaczy wspólczynnik v wynosi wtedy:
v = 1 / ?2 ? 0.707
Z kolei słabi arcymistrzowie uzyskują powiedzmy z grubsza 4:1 proporcję, gdy grają z silnymi mistrzami, co z grubsza oznacza 24:1 proporcję rankingu najsilniejszych graczy globu porównaną z silnymi mistrzami (przypominam, że mowa jest o multiplikatywnej funkcji rankingowej; wszystkie takie proporcje mają znaczenie tylko statystyczne, a nie pomiędzy indywidualnymi graczami). Zatem wspólczynnik v partii pomiędzy super elitą i silnym mistrzem wynosiłby połowę: v = .5, czyli waga partii na konto różnicy siły gry byłaby tylko połową wagi partii pomiędzy równymi przeciwnikami.
Komentarz (?): Wspólczynnik v jest multyplikatywny (patrz Postulat 3): gdy zachodzi proporcja rankingów:
A / B = C / D
to współczynnik v dla pary A B jest równy współczynnikowi v dla pary C D.
2. UWAGI KOŃCOWE
Przedstawiłem system, w którym waga partii zależy wyłącznie od rankingu, doświadczenia i aktywności grających. Inaczej jest w tenisie. Waga meczu w tenisie zawodowym zależy od rangi turnieju. Stwarza to zależność rankingu od instytucji organizujących zawody, oraz - przede wszystkim i co gorsza - od centralnej federacji tenisowej. Jest to niezgodne z duchem wolności i decentralizacji (modularności) świata sportowego czy też w ogóle ludzkiego. Nie powinno byc żadnych centralnych federacji, a instytucja rankingu powinna być maksymalnie niezależna od innych instytucji świata sportowego. Technologia pozwala prowadzić zatrzęsienie różnych rankingów. Tym ważniejszym jest, żeby w ramach jedenj i tej samej firmy rankingowej dominowała ranking tylko jedna funkcja, a przynajmniej tylko jedna strategia. W skali całego świata szachowego rynek dominować powinny ze 2-3 firmy, których dominacja nad wieloma innymi byłaby wynikiem lepszej jakości ich pracy. Strategia każdej takiej głównej firmy rankingowej powinna być równie przekonująca, prosta i pełna jak ta, którą tu przedstawiam.Przy ważeniu najważniejsze są dokładne odważniki (a wagę i proces ważenia zawsze można skonstruować). Podobnie w kwestii rankingu najważniejsza jest baza danych partii szachowych. Taka baza (gdy chodzi o graczy grających w miarę poważnie) powinna być własnością publiczną.
W oparciu o bazę danych firma rankingowa oraz narzędzia oprogramowania, a może nawet każdy z dostępem do komputera i Internetu, powinien być w stanie ad hoc stworzyć listę rankiingową o bardzo dowolnych założeniach.
Firma rankingowa oprócz rankingu sensownie stabilnego może prowadzić listy dynamiczne, które akcentują aktywność graczy. Tak jak w systemach podobnych do ELO, tak i w moim wystarczy zmienić jeden parametr. Detale podam w następnym odcinku. Można też prowadzić listy dla bieżącego roku kalendarzowego (takie listy, by były ważkie, wymagają starannych definicji). Itd.
Firma rankingowa może prowadzić, oprócz list powszechnych i elitarnych, także symulację historyczną, obejmującą silnych graczy z przeszłości. Na liście historycznej wyniki z przeszłości miałyby pewien wpływ na rankingi obecnych graczy, co nawet byłoby ciekawe. Nie sądzę, żeby wpływ był bardzo istotny. Trudno też o pełny efekt, gdyż w kolejnych epokach szachowych, idąc w tył, grano oficjalnie coraz mniej, a danych zachowano jeszcze mniej.
Część 1
Włodzimierz Holsztyński