ПАВЛОВ С. В. к. ф-м. н. , председатель всероссийской комиссии по рейтингу в Го. Система рейтинга в го. Павлов Сергей Владимирович (11.04.1949) Город: НовосибирскСайт: http://www.Sibgo.narod.ru/ Звание или разряд: 4 Достижения:1977 — 1 ; 1980 — 4 ;1977 — 2 место ; 1978 — 4 место ; 1979 — 4 место СИГО расшифровывается как "соревнование на звание Сильнейшего Игрока ГО страны", т.е. фактически неофициальное первенство СССР, так как до 1984 года в СССР никакой официальной спортивной организации по го не существовало и все делалось исключительно на энтузиазме. Закончил механико-математический факультет НГУ (1972), к.ф.-м.н. (1982). Познакомился с игрой Го в декабре 1975 года по публикациям в журнале «Наука и Жизнь», участвовал с конца 1975 года в конкурсе решения задач. С 1976 года – председатель правления «Клуба любителей Го» НГУ, первого сибирского клуба Го, затем аналогичного клуба Го СО АН СССР, президент Сибирского клуба Го, а с 1992 года – Ассоциации Го «Сибирь-Япония». В 1977 году в первых всесоюзных соревнованиях победил на всех отборочных этапах, а в финале занял второе место. В первом официальном Чемпионате СССР в январе 1990 года (Ленинград) занял 12-е место среди 66 участников. Многократный чемпион города. Занимаясь с конца 70-х проблемами рейтинга, в 1990 году предложил проект рейтинг-системы, принятой в дальнейшем в России и на Украине и в основе своей используемой до сих пор. В 2003 году разработал новый проект, с учетом накопленного опыта и на основе анализа статистического материала, и был назначен председателем рейтинг-комиссии РФГ(Б). «Система Томпсона используется профессиональной шахматной федерацией, которая была создана в противовес ФИДЕ. В основу положен принцип максимума правдоподобия и ищутся такие значения рейтингов (итерационно), которые обеспечивают максимум некоторой функции вероятностей. Т.е. подбираются значения, при которых полученные результаты имели бы в интегральном смысле наибольшую вероятность осуществиться. Сейчас она достаточно популярна и используется также на ряде интернет-серверов для игры Го, и даже АГА - Американской Го Ассоциацией (игра в реале). Главный недостаток системы - влияние всех результатов, в том числе полученных явно при другой, несоответствующей текущему уровню рейтинга силе игры (если я сыграл партию полгода назад, то мог иметь уровень на один, два или три разряда отличающийся от текущего, для которого мы вычисляем рейтинг). Это проблема баланса точности и динамичности рейтинг-системы, не разрешимая в рамках принципа максимума правдоподобия для рейтингов в человеческой деятельности (может, в неживой природе это и работает?). Система Эло (а это уже есть дискретная цепь Маркова, учитывающая только предыдущее состояние системы, в отличие от системы Томпсона), приспособлена к применению, в том числе и в командных видах спорта. То, что результаты применения системы хорошо согласуются с получаемыми спортивными результатами неудивительно - значит общая математическая идея верна. Но вопрос точности, куда с необходимостью входит и достоверность (в теоретико-вероятностном смысле), требует специального рассмотрения. Система Глико (автор - Гликман, 1998 г.) является наиболее математически продвинутой и обоснованной. Но и она недостаточно учитывает (или даже вообще в явном виде не использует) такие явления, как аномальный рост силы отдельных игроков. В моем проекте присутствуют практически все основные моменты системы Глико в несколько упрощенном для вычислений и практического применения виде. Суть моих предложений - в балансе точности и динамичности. Кроме того, сама система имеет много параметров, по которым на основе апостериорно заданных результатов можно проводить оптимизацию. Применение (корректное) моей схемы с единой точкой отсчета всех рейтингов автоматически приведет к согласованию всех РС независимо от межсистемных контактов. При этом я не претендую на то, что предложенное мной применимо в любом виде спорта, включая командные. Но общая идея определения характеристик функции вероятностей, методика выбора параметров РС, коррекция "аномальных" результатов могут использоваться гораздо шире, чем просто в РС для игры Го. 1. Общая концепция РС Каждый игрок, входящий в рейтинг-систему (РС), получает рейтинг-коэффициент (РК), соответствующий уровню игры (мастерства). Текущая оценка (рейтинг) уровня игры имеет определенную точность (доверительный интервал) и достоверность. При заданном доверительном интервале достоверность рейтинга отдельных игроков характеризуется коэффициентом стабильности КC, который равен 1, если достоверность соответствует выбранному в РС уровню (т.е. доверительная вероятность не менее заданного уровня, например 90%). При регулярном участии в турнирах, учитываемых как рейтинговые, и при незначительных колебаниях рейтинга (низкая дисперсия) достоверность рейтинга игрока приближается к 100% (т.е. становится больше, например, чем 90%) и КC остается равным 1. Достоверность падает при длительном неучастии в турнирах или большой дисперсии результатов игрока (нестабильная игра). Влияние игрока на рейтинг других игроков находится в прямой зависимости от достоверности его рейтинга (чем ниже достоверность, тем меньше влияние на рейтинг других). При резком увеличении рейтинга и достаточной достоверности прогноза дальнейшего его роста производится специальная корректировка рейтинга для обеспечения динамичного отслеживания реального изменения силы игры и уменьшения отрицательного влияния несоответствия рейтинга растущего игрока его уровню игры (корректировка аномального роста). Рейтинг-система согласовывается с традиционной квалификационной системой кю-данов, для чего в ней предусматривается учет партий на форе, в том числе и при несоответствии форы и разницы рейтингов партнеров, а шкала РС имеет однородную структуру - разнице в один дан традиционной системы соответствует 100 очков разницы рейтингов. Для привязки всей системы, обеспечения меньшего смещения общего рейтинга, вся совокупность игроков разбивается на несколько групп по уровням игры и регулярно делаются поправки, рассчитываемые по изменению рейтинга наиболее стабильных игроков (анкеров) из верхней части каждой из выделенных групп. Все параметры РС контролируются и уточняются на основе мониторинга РС с использованием современных методов статистической обработки экспериментальных данных. 2. Вхождение в РС Каждому игроку, входящему в рейтинг-систему, должен быть присвоен рейтинг-коэффициент (РК) с коэффициентом стабильности (КC) выше нуля. Не входящие в РС игроки выступают в турнирах с условным рейтингом, назначаемым проводящей организацией с учетом пожеланий игрока и др. факторов. Такие игроки не влияют на рейтинг игроков из РС. Если игрок, выступающий в турнире с условным рейтингом, не возражает против включения его в РС, то по результатам турнира ему может быть присвоен РК и вычислен начальный коэффициент стабильности КC. Для этого необходимо, чтобы данный игрок одержал в турнире хотя бы одну победу над игроком из РС. Тогда его начальный, или "входной" в РС, рейтинг РК вычисляется следующим образом (методика "максимального правдоподобия"). Находим средний РК соперников (только из РС) - РКср. Если квалифицируемый игрок имеет абсолютный результат (100% побед), то вычисляем вероятность выигрыша Р в партии с усредненным игроком с рейтингом РКср из условия, что 100%-й результат в теоретико-вероятностной схеме Бернулли при N партиях имеет вероятность 50%. Это условие есть Р^N = 0.5 (Р в N-ой степени), откуда находим Р как корень N-ой степени из 0.5. В противном случае определяем Р как отношение набранных очков к числу партий (снова только с игроками из РС). По найденному значению Р вычисляем смещение рейтинга квалифицируемого игрока от РКср. Например, при N = 1 (ровно одна партия и одна победа) берем в качестве начального РК рейтинг соперника, у которого выиграл данный игрок. При N = 5 и счете 4:1 получим в условиях применяемой сегодня в России рейтинг-системы примерно такой результат (80% побед, Р = 0.8): РК = РКср + 200, при счете 5:0 получим примерно (Р = 0.87 -- корень пятой степени из 0.5): РК = РКср + 230. Начальный КC присваивается с учетом числа сыгранных партий с игроками из РС и их среднего КCср: при N>4 задаем КC = 0.5 КСср (достоверность не более 50%); при меньшем числе -- 0.1 N КСср, но не менее 0.1; 3. Базисная схема пересчета рейтинга Для пересчета рейтинга используется обобщенная формула Эло: РК = РКнач + SUM ( Ki · (Ri - Pi)). Здесь Ri -- результат i-той партии (1 или 0), Рi -- вероятность победы в той же партии, Кi -- коэффициент динамичности для данной партии. Базисный коэффициент динамичности K зависит от рейтинга игрока и от его коэффициента стабильности KС, и эти зависимости описываются ниже в разделе, посвященном выбору параметров РС. Для уменьшения влияния на рейтинг игрока тех партнеров, у которых KC<1, Кi получается из K умножением на KСi (KС, т.е. коэффициент стабильности, i-го соперника). Теоретико-вероятностный анализ на основе современных методов математической статистики, применяемых для проверки гипотез, показал, что конкретный вид функции вероятности р(DРК), используемой при вычислении Рi, не имеет существенного значения - важен наклон производной в точке 0, т.е. где р(0) = 0.5. Более того, тщательный анализ статистических данных Европейской Федерации Го позволил сделать заключение о том, что по параметру DРК эта функция линейна (аналогичный результат получен для шахматных рейтингов): p(DPK) = 0.5 + Кр · DРК/100 , где коэффициент наклона Кр в свою очередь зависит от среднего рейтинга партнеров (эта зависимость приводится ниже в разделе: "Выбор параметров РС"). 4. Достоверность, коэффициент стабильности и понятие аномального результата Достоверность рейтинга игрока в РС определяется стабильностью его выступлений, т.е. тем, насколько его результаты близки к прогнозируемым. Параметром, учитывающим достоверность рейтинга, является коэффициент стабильности KС, который равен 1, если выполняются условия РС по достоверности в указанном выше смысле и игрок регулярно участвует в турнирах. Таким образом, изменение KС зависит от двух факторов: срока последнего участия в турнирах и дисперсии результатов. Соответственно, пересчет KС состоит из двух этапов. Перед пересчетом рейтинга в турнире уточняются входные значения KС всех игроков умножением на коэффициент Kвр, рассчитываемый в зависимости от времени t неучастия в турнирах:
t (мес.): |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
Квр |
0.9 |
0.8 |
0.7 |
0.6 |
0.5 |
0.4 |
0.3 |
0.2 |
0.1 |
При меньшем времени Квр = 1. Можно рассматривать и другие формулы для Квр (например, интерполяцию с 6 мес. до 3-х лет: Квр = 1 - (t - 6)/30). Здесь главное -- принцип расчета. При пересчете рейтинга используется КC, получаемый умножением входного КC на коэффициент 1 - Кан, учитывающий аномальность выступления игрока в турнире, а коэффициент аномальности Кан определяется следующим образом. Результат выступления любого игрока в турнире можно рассматривать как реализацию схемы Бернулли, т.е. серию исходов 1 или 0 с вероятностями Р и 1 - Р, где Р -- вероятность выигрыша в партии с усредненным игроком с рейтингом РКср. Дисперсия в этой схеме равна D = N·Р·(1 - Р), а среднее квадратическое отклонение S = D^0.5 -- корень квадратный из дисперсии. Например, для N = 6 (типично для России) и Р = 0.5 (примерно равный состав игроков) имеем S = 1.225. Для N = 10 аналогично получаем S = 1.581. При конкретном расчете Р может быть любым, но всегда можно определить S. Будем считать результат нормальным (Кан = 0), если |Nпоб - Nож| 0: при 2S > |Nпоб - Nож| >S: Кан = |Nпоб - Nож| /S - 1;при |Nпоб - Nож|>2S: Кан = 1;если среднее значение КCср для партнеров окажется меньше единицы, то полученноепо данным формулам значение Кан умножается на КCср. Окончательное значение КC вычисляется после всех пересчетов: входной КC (если он оказался перед началом турнира меньше 1) увеличивается с учетом числа сыгранных партий (по 0.1 за каждую партию, но так, чтобы КC не стал больше 1). Затем полученное значение уточняется -- умножается на 1 - Кан и округляется до десятых долей, причем КС должен быть не менее 0.1. Это значение и сохраняется до следующего выступления игрока в турнирах. Для игроков с положительным приростом рейтинга по базисной схеме пересчета, после проверки аномальности результата рейтинг может быть уточнен по схеме "корректировки аномального роста": при Кан > 0 (аномальный рост) вычисляется РКан -- значение "аномального" рейтинга по методике "максимального правдоподобия", описанной в разделе "Вхождение в РС", и конечный рейтинг определяется с помощью интерполяции между базисным значением РК и РКан: РКкон = РК х (1 - Кан) + РКан х Кан . 5. Выбор параметров РС Анализ статистических данных EGF (Европейской Федерации Го), учитывающих 108631 партию, позволил выявить фундаментальные закономерности, в том числе характер зависимости функции вероятностей p(DPK) от разницы рейтингов (она оказалась линейной) и производной от этой функции (коэффициент наклона кривой -- Kр) от среднего рейтинга партнеров. Оказалось, что все кривые зависимости p(DPK) при фиксированном значении DPK как функции рейтинга имеют общую вертикальную асимптоту, соответствующую идеальному игроку, у которого выиграть невозможно ни при какой разнице рейтингов. Расчеты, проведенные с помощью современных методов статистической обработки данных, позволили определить значение рейтинга, соответствующее этой асимптоте, которое оказалось равно 10 дану (3000 очков) с точностью до сотых долей процента. Обозначим через DG - "расстояние" партии по оси рейтинга от точки 10 дан, т.е. разницу рейтинга идеального игрока и среднего рейтинга партнеров, выраженную в данах (или можно все считать в очках рейтинга, что не принципиально, тогда в формулах кое-где появятся коэффициенты 100). Тогда коэффициент Kр имеет вид: Kр = 1/ DG. Такая простая форма коэффициента Kр также была получена методами математической статистики и подтверждена сопоставлением со статистическими данными. Из вида полученной функции следует, что вероятность победы более сильного (естественно, обрезаем график функции p(DPK) по значению p = 1) становится равной 1 тем быстрее, чем ближе рейтинг этого игрока к предельному значению 3000 очков (и теоретически это должно быть недостижимым значением). Коэффициент динамичности Ki определяется базисным коэффициентом K и коэффициентами стабильности партнеров. Он отвечает в РС за динамичность, т.е. за скорость изменения рейтинга по результатам отдельного пересчета. С другой стороны, высокая динамичность (большой коэффициент) снижает возможную теоретически достижимую точность. Поэтому выбор базисного коэффициента динамичности должен быть компромиссом между этими двумя противоположными тенденциями. Чтобы этот баланс между возможной точностью и динамичностью соблюдался равномерно по всей шкале, необходимо K выбирать пропорциональным "расстоянию" игрока от предельного значения по рейтингу - 3000 очков. Коэффициент пропорциональности, при вычислении расстояния в данах, предлагается 2: тогда для 5-го дана K = 10 -- всем привычное значение. В нижнем конце шкалы тогда коэффициент K приближается к значению 60. Заметим, что в РС EGF эти коэффициенты почти в два раза выше, что оправдано необходимостью обеспечить достаточную динамичность системы. Однако в данном проекте есть дополнительный эффективный механизм повышения динамичности за счет коррекции аномального роста и использования коэффициентов стабильности, что и позволяет брать меньшие значения для K, т.е. рассчитывать на большую точность. Предлагается коэффициент динамичности K корректировать с учетом коэффициента стабильности с поправочным коэффициентом Kо, определяемым из таблицы:
КC |
0.1 |
0.2 |
0.3 |
0.4 |
0.5 |
0.6 |
0.7 |
0.8 |
0.9 |
1.0 |
Ко |
4.0 |
3.5 |
3.0 |
2.5 |
2.0 |
1.8 |
1.6 |
1.4 |
1.2 |
1.0 |
т.е. динамичность повышается тем больше, чем ниже коэффициент стабильности игрока. 6. Анкеры и привязка РС Для обеспечения контроля за точностью РС, привязки групп игроков к равномерной и однородной шкале кю-данов необходимо проводить мониторинг РС. Кроме того, надо согласовывать РС с другими РС (европейской например). Одним из способов мониторинга является введение так называемых "анкеров", то есть игроков, показывающих наиболее стабильные и предсказуемые результаты, имеющих коэффициент стабильности постоянно равный единице и активно играющих в турнирах. Если выделенная группа анкеров проявляет тенденцию к сдвигу рейтинга по отношению к выше расположенной группе (например, кю игроки по отношению к дан-игрокам), то это означает необходимость корректировки рейтинга всей нижней группы целиком. Аналогично контролируется возможная деформация шкалы всей группы по выделенной группе анкеров. Принадлежность к группе анкеров устанавливается по предыдущему периоду до следующей контрольной отметки (например полгода). Получение игроком аномального результата немедленно выводит его из группы анкеров. Самая верхняя группа РС (в мировом масштабе это профессиональные игроки Японии, Кореи и Китая) может быть привязана к единой точке отсчета (10 дан) методами математической статистики, матанализа и вычислительной математики, так как все фундаментальные функциональные закономерности заданы в явном виде. 7. Связь РС с форовым принципом Важную роль в стабилизации РС, повышении точности рейтинга и устранении возможных деформаций играют рейтинговые турниры с гандикапом (форой), особенно при форе, максимально точно соответствующей разнице рейтингов. Поэтому РС учитывает возможность обсчета таких турниров, при этом предполагается, что фора нелинейно отражает разницу в уровне игры в данах и кю, но эта нелинейность не оказывает существенного влияния на стабилизирующую роль форовых турниров, так как на большой статистике вносимые ошибки (которые и так невелики) гасятся за счет нормальности своих распределений (подтверждается статистическими данными). Предлагается следующая формула аппроксимации форы в n камней соответствующей компенсацией в очках (Коми): Коми = 7 (2n + a n (n - 1) - 1). Эта формула выведена в предположении, что каждый новый камень форы усиливается ранее выставленными с постоянным "коэффициентом усиления" 1 + a , определяемым из условия, что Коми при 9-ти камнях форы равно 140 очков. Отсюда находим: a = 1/24, то есть действительно нелинейность форы незначительна. 9. Организационно-методические вопросы К организационно-методическим вопросам следует отнести: определение интервала пересчета рейтинга (раз в квартал, в месяц, после каждого турнира и т.п.); обеспечение своевременного учета в рейтинге прошедших турниров; согласование РС РФГ(Б) с рейтингом EGF и другими рейтинг-системами, выработка рекомендаций по рейтингу для единой спортивной классификации и т.д. С учетом российского опыта и опыта других стран, международного опыта применения РС в Го, а также опыта применения РС типа Эло в шахматах, рекомендуется производить обсчет рейтинга после каждого турнира. Для обеспечения оперативности и простоты контроля ошибок предлагается создать на одном из го-сайтов интерактивную программу с базой данных по партиям и турнирам, доступ к которой будет возможен через Интернет практически любому желающему посчитать рейтинг по РС РФГ(Б) для любого турнира. Обязанности по контролю за соблюдением дисциплины должны быть возложены на президиум РФГ(Б). Также к данной группе вопросов следует отнести разработку методик определения точности РС, мониторинга параметров, уточнения механизмов контроля и корректировки РС, проведение других специальных исследований. Данная задача ставится перед рейтинг-комиссией при президиуме РФГ(Б), осуществляющей свою деятельность на основании утвержденного положения и выпускающей регулярные рейтинг-листы и, по мере необходимости, информационные бюллетени. ЗАКЛЮЧЕНИЕ В результате введения новой РС будут прежде всего устранены те причины, которые привели к отрицательным явлениям, отмеченным при анализе ситуации в российском рейтинге. Если при этом будет произведена коррекция текущего рейтинга с учетом имеющихся деформаций, то новая РС должна оказаться согласованной с европейским рейтингом, причем по крайней мере не хуже, чем применяемая в настоящее время. Благодаря выявленным фундаментальным закономерностям в распределении вероятностей не только открылась возможность использовать единую точку отсчета для всех применяемых в мире Го РС, но и создана методологическая база построения в перспективе единой РС, объединяющей как любителей, так и профессионалов во всем мире».
Полозов, А.А. Система рейтинга в игровых видах спорта и единоборствах: Монография. Екатеринбург: Изд-во УГТУ-УПИ, 1995. 110 с. Полозов, А.А. Рейтинг в спорте: вчера, сегодня, завтра / А.А.Полозов. – М.:Советский спорт, 2007 – 316с. www.polozov.nemi-ekb.ru
|