2023-02-18, чгк

trueDL — новый алгоритм расчёта сложности турниров

Как сейчас считается DL

Сейчас DL турнира — среднее арифметическое командных DL. Командный DL рассчитывается по такой формуле:

DL = R * M / N / 500

R — рейтинг команды, M — количество невзятых вопросов, N — количество вопросов в турнире.

И в M, и в N не учитываются снятые вопросы.

Почему DL работает плохо

DL не учитывает инфляцию рейтинга

В 2017 году у команды с первого места рейтинг был 11182, c сотого — 4855.

В 2023 году у команды с первого места рейтинг 12151, а c сотого — 8017. При этом не кажется, что за прошедшие годы команды стали играть значительно лучше, но DL со временем ползёт вверх. То, что несколько лет назад было 4.0, сегодня уже 5.0.

В качестве примера посмотрим на команду «Рабочее название». В 2017 году команда сыграла «Ивантеллект Pale Ale» и взяла 25/36. DL был равен 5.42:

8876 × 11 / 36 / 500 = 5.42

В 2023 году команда сыграла «Синхрон Моносова» и взяла 26/36. DL был равен 5.68:

10229 × 10 / 36 / 500 = 5.68

Несмотря на это, мы понимаем, что если бы сегодняшние команды сыграли Ивантеллект 2017 года, то скорее всего турнир оказался бы сложнее синхрона Моносова, а не проще.

Непонятно, что значит DL

Если нам покажут DL 5.0 и спросят, что мы можем сказать про этот турнир, мы не сможем сказать ничего кроме того, что турнир «средней сложности».

Как trueDL решает эти проблемы

Не зависит от инфляции

TrueDL привязан не к абсолютным цифрам командного рейтинга, а к месту команды в рейтинге.

Имеет физический смысл

TrueDL=5.0 у синхрона из 36 вопросов означает: команда с 251–500 мест рейтинга возьмёт на этом турнире половину вопросов, а команда из топ-10 — 29 вопросов.

Как считается trueDL

Коэффициенты для формулы

Я предположил, что если мы привяжемся не к абсолютным цифрам рейтинга, а к месту команды в рейтинге, то от года к году мы можем наблюдать относительную стабильность. То есть: команда с 500 места рейтинга будет в среднем всегда брать, например, в два раза меньше вопросов, чем команда с первого места.

Чтобы проверить гипотезу, я разделил все команды на несколько групп: команды с 1–10 мест рейтинга, 11–25, 26–50, 51–100, 101–250, 251–500 и так далее. После этого я посчитал, сколько команды брали относительно друг друга в тех турнирах, где участвовали команды из разных групп.

Допустим, у нас есть турнир, в котором участвовали команды с 1–10 мест рейтинга и команды с 251–500 мест. Первые команды в среднем брали 26 вопросов, а вторые — 13.

Получается, на этом турнире командам с 251–500 мест соответствует цифра 0.5: 13 / 26 = 0.5.

Если так же усреднить данные по всем турнирам, получится вот что:

Команд из топ-10 на этом графике нет, потому что им всегда соответствует единица.

Видно, что несмотря на некоторые колебания, начиная с 2017 года показатели относительно стабильны. Вот что получится, если их усреднить:

1–10 — 1.0
11–25 — 0.94
26–50 — 0.89
51–100 — 0.82
101–250 — 0.72
251–500 — 0.62
501–1000 — 0.5
1001–2000 — 0.37
2001–3000 — 0.27
3001–5000 — 0.19

То есть, если команды с 1–10 мест в среднем возьмут 30 вопросов в турнире, то команды с 11–25 мест — 30 × 0.94 = 28.2, команды с 26–50 мест — 30 × 0.89 = 26.7 и так далее. Команды с 501–1000 мест в среднем берут вопросов почти ровно в два раза меньше, чем команды из топ-10.

Чтобы итоговые значения trueDL выглядели привычно, возьмём за единицу коэффициент команды с 251–500 мест:

1–10 — 1.61
11–25 — 1.52
26–50 — 1.43
51–100 — 1.32
101–250 — 1.16
251–500 — 1.0
501–1000 — 0.81
1001–2000 — 0.6
2001–3000 — 0.43
3001–5000 — 0.31

Формула trueDL

Теперь мы можем вывести формулу, по которой считается trueDL:

trueDL = (1 — min(Q / C, N) / N) × 10

Q — вопросы, взятые командой, C — коэффициент из таблички выше, N — общее количество вопросов на турнире (исключая снятые).

Примеры расчёта trueDL

Возьмём команду с 251–500 мест рейтинга. Если она взяла 18/36 вопросов, её командный trueDL будет 5.0, если 24 — 3.3, если взяла всё, trueDL будет 0, если не взяла ничего — 10.

Для сравнения, если команда из топ-10 взяла 18/36 вопросов, её trueDL будет 6.89:

(1 — (18 / 1.61) / 36) × 10 = 6.89

Если команда взяла 24 — её trueDL 5.85:

(1 — (24 / 1.61) / 36) × 10 = 5.85

Если взяла 36, то trueDL будет 3.78:

(1 — (36 / 1.61) / 36) × 10 = 3.78

Если не взяла ничего — trueDL 10, как и у команды с 251–500 мест.

TrueDL турнира, как и текущий DL, равен среднему арифметическому командных trueDL.

Немного статистики

Самые cложные турниры по trueDL

Тут и далее — только турниры, где корректно введены данные и где сыграло больше 50 команд. Подробные данные можно посмотреть в таблице, ссылка на которую также есть в приложении.

Мемориал Дмитрия Коноваленко — 2018 — cамый сложный очник, 7.8.

Самые простые турниры по trueDL

Тут без сюрпризов.

Школьный Синхрон-lite. Выпуск 3.1 — trueDL 0.2
(а)Синхрон-lite. Лига старта. Эпизод VII — 0.2
(а)Синхрон-lite. Лига старта. Эпизод IX — 0.2
Школьный Синхрон-lite. Выпуск 3.6 — 0.2
Школьная лига. VI тур. — 0.2
(а)Синхрон-lite. Лига старта. Эпизод I — 0.3
Школьный чемпионат России — 0.3
Школьный Синхрон-lite. Выпуск 3.3 — 0.3
(а)Синхрон-lite. Лига старта. Эпизод X — 0.3
Школьный Синхрон-lite. Выпуск 3.5 — 0.3
(а)Синхрон-lite. Лига старта. Эпизод XII — 0.3
Школьная лига. I тур. — 0.3
Лига вузов Европы. Пролог. Кубок первокурсников — 0.3

Школьный чемпионат России — 2019 — cамый простой очник на турнирном сайте, 0.3.
День физика — 2018, 0.7 — самый простой нешкольный очник.

Ожидаемое количество взятых для турнира с trueDL 4.0

1–10 35
11–25 33
26–50 31
51–100 29
101–250 25
251–500 22
501–1000 17
1001–2000 13
2001–3000 9
3001–5000 7

Ожидаемое количество взятых для турнира с trueDL 7.0

1–10 17
11–25 16
26–50 15
51–100 14
101–250 13
251–500 11
501–1000 9
1001–2000 6
2001–3000 5
3001–5000 3

Калькуляторы сложности

По trueDL

Позиция вашей команды в рейтинге

Количество вопросов в турнире

Сложность турнира

Ожидаемое количество взятых:

По текущему DL

Рейтинг вашей команды

Количество вопросов в турнире

Сложность турнира

Ожидаемое количество взятых:

Код и данные

Код лежит на гитлабе: https://gitlab.com/peczony/truedl
Гугл-табличка с trueDL для всех турниров.
Данные на гугл-диске (260 Мб)

Основная часть данных выкачана по АПИ (персональные данные удалены), исторические данные о рейтинге любезно предоставлены командой турнирного сайта.

← prev · next →