Полное руководство по прогнозной аналитике баскетбола в колледже

05.27.2021
Ты умнее типичного фаната студенческого баскетбола. Вы слышите о спортивной аналитике и хотите узнать больше о том, как она применима к студенческому баскетболу.
Может быть, сейчас ноябрь, и вы хотите сделать ставки на несколько игр, поскольку штаты продолжают легализовать ставки на спорт. Может быть, сейчас март, и вам нужно преимущество в выигрыше турнирного пула NCAA.
В этой статье рассматриваются основные концепции университетской баскетбольной аналитики, такие как количество очков за владение мячом и четыре фактора. Он делает это, задавая два вопроса:
- Как сделать прогноз на игру?
- Имеют ли значение матчи для предсказания игры?
Статья заканчивается тщательно подобранным списком для дальнейшего чтения. Этот список охватывает случайность трехочковых выстрелов, ансамблевые методы для составления прогнозов и способы выиграть свой пул мартовского безумия.
1. Как делать прогнозы на основе количества очков за владение мячом
Предположим, Гонзага и штат Мичиган столкнутся в турнире чемпионата NCAA. Вы хотите сделать прогноз для этой игры на основе данных.
Первое, что нужно учитывать при прогнозировании, - это темп игры. Гонзага любит подниматься и опускаться по полу, в то время как штат Мичиган предпочитает игру на половине корта.
Исходя из этой разницы в стилях, нет смысла смотреть на очки за игру. Чтобы получить более точную оценку силы команды с учетом темпа, аналитическое сообщество смотрит на количество очков за владение мячом.
Хотя набрать очки в игре тривиально, счет в коробке не показывает количество владений промокод 1вин при регистрации. Давайте посмотрим, как оценить это число.
1а. Оценка имущества
Чтобы оценить количество владений в игре по счету коробки, давайте рассмотрим, чем может закончиться владение мячом.
Одним из способов прекращения владения является переход (TO). Счетчик в ячейке отслеживает каждый оборот, поэтому каждый оборот считается за одно владение.
Затем рассмотрим владение мячом при попытке броска с игры (FGA). Владение заканчивается после попытки броска с игры в двух ситуациях:
- преступление делает выстрел
- нападающий не попадает в цель, и защита получает отскок
Владение мячом могло быть продлено, если нападение перехватило отскок (OREB). Чтобы учесть эти 3 ситуации, мы оцениваем владение мячом с игры с игры, выполненной FGA - OREB. Подборы в атаке вычитаются, потому что нападающий может сделать два броска за одно владение мячом, если они получили отскок в нападении.
Владение мячом также может заканчиваться штрафными бросками. Если каждый штрафной бросок выполнялся парным из-за фола при стрельбе, то количество владений было бы половиной попыток штрафного броска (FTA). К сожалению, это не всегда так, поскольку преступление может:
- получить один штрафной бросок после забитой корзины
- получить три штрафных броска, если нарушен трехочковый
- пропустить передний конец однозначного
Вместо половины вам нужен другой фактор, который учитывает эти ситуации. Кен Помрой использует 0,475, и я тоже использую этот коэффициент в своих расчетах.
Чтобы оценить владение (POSS) из коробки:
POSS = FGA - OREB + TO + (0,475 * FTA)
В студенческом баскетболе команды могут отличаться по количеству владений на два, если одна команда получает дополнительное владение каждый тайм. Чтобы оценить владение мячом в одной игре, вы применяете эту формулу к обеим командам и берете среднее значение.
В течение сезона 2019-20 гг. Баскетбольные команды колледжей в среднем забивали около 70 мячей за игру. Гонзага была одной из самых быстрых команд, так как в среднем они забивали 74 мяча за игру. Мичиган Стэйт сыграл в среднем 70 мячей.
Можно получить более точный подсчет владения мячом с помощью игровых данных. Это также представляет интересную возможность исключить владение мячом в конце игры с преднамеренными фолами, поскольку они не отражают нормальный ход игры.
1b. Рейтинг баскетбольных команд колледжей
Чтобы оценить баскетбольные команды колледжей в нападении и защите, мы используем очки за владение мячом в качестве показателя эффективности. В последнем разделе показано, как оценить владение мячом из коробки.
В сезоне 2019-20 гг. Баскетбольные команды колледжей набирали в среднем 100,5 очка на 100 владений мячом. Нападение получает очко каждый раз, когда у них есть мяч.
Чтобы перейти от количества очков за владение к баскетбольному рейтингу в колледже, вам нужно приспособиться к графику. В студенческом баскетболе есть множество команд, и каждый фанат осознает разницу в игре штата Мичиган и штата Миссисипи-Вэлли.
Есть много способов приспособиться к графику. Здесь я сосредоточусь на методах Кена Помероя, поскольку его рейтинги по баскетболу в колледже являются наиболее широко известными.
Для корректировки графика Pomeroy использует метод наименьших квадратов. Это также основная идея линейной регрессии, методики анализа данных, наиболее часто используемой для нахождения корреляции между двумя переменными. Для наглядного пособия по регрессии щелкните здесь.
Этот метод наименьших квадратов также влияет на рейтинг команд на сайтах Sports Reference. Они называют это простой рейтинговой системой (SRS), и этот метод присваивает рейтинг каждой команде в студенческом баскетболе. Разница в рейтинге между двумя командами дает прогноз на будущую игру.
Для выполнения этого расчета компьютер изменяет рейтинги для всех 353 команд до тех пор, пока рейтинги не будут соответствовать критериям. Этот критерий заключается в том, что эти рейтинги минимизируют ошибку между прогнозом на основе рейтингов и фактическими результатами игры.
Помрой делает еще один шаг вперед, рассматривая нападение и защиту для каждой баскетбольной команды колледжа. Вместо 353 переменных его код изменяет 706 переменных, чтобы свести к минимуму ошибку эффективности по очкам за владение в играх.
Поскольку эти переменные решаются одновременно, рейтинг атаки для Гонзаги зависит от 705 других рейтингов атаки и защиты. Рейтинг защиты штата Мичиган имеет значение для нападения Гонзаги, даже если Гонзага и штат Мичиган еще не сыграли.
В своих расчетах Помрой уделяет больше внимания недавним играм. После выполнения этих вычислений методом наименьших квадратов вы получите рейтинг атаки и защиты на kenpom.com. Эти два числа складываются в рейтинг его команды.
Теперь давайте посмотрим, как эти скорректированные показатели эффективности означают прогноз для игры.
1c. Делаем прогноз
Теперь, когда рейтинги атаки и защиты основаны на количестве очков за владение мячом, мы можем делать прогнозы на игры. Давайте использовать Гонзага против штата Мичиган в качестве примера.
Во-первых, подумайте, что означают рейтинги атаки и защиты. Например, если Гонзага имеет рейтинг 115 очков за 100 владений, то ожидается, что они наберут 115 очков за 100 владений против средней баскетбольной защиты колледжа.
В качестве другого примера, штат Мичиган может иметь рейтинг защиты в 90 очков на 100 владений. Это означает, что ожидается, что они позволят набрать 90 очков на 100 владений мячом против среднего нарушения баскетбола в колледже.
Чтобы сделать прогноз между атакой Гонзаги и защитой штата Мичиган, вы должны учитывать, что защита штата Мичиган намного лучше, чем в среднем.
Для этого нужно учитывать отклонение рейтинга команды от среднего. Чтобы упростить математику, давайте воспользуемся средней эффективностью 100 очков на 100 владений.
Нападение Гонзаги на 15 очков лучше, чем в среднем по баскетболу в колледже, но защита штата Мичиган на 10 очков лучше среднего, оба на 100 владений. Лучшая защита имеет более низкий рейтинг.
Распространенный способ сделать прогноз - это то, что нападение Гонзаги будет набирать 5 очков за 100 владений мячом лучше, чем в среднем. Это потому, что 15 (отклонение Гонзаги от среднего значения в нападении) минус 10 (отклонение штата Мичиган от среднего значения в защите) равно 5. Это тот же метод, который я использую с ярдами за игру и показателем успеха в прогнозах футбола в рейтинге Power Rank.
Прогнозируется, что Гонзага наберет 105 очков за 100 владений мячом против штата Мичиган. Если вы увеличите эту эффективность до 70 владений за игру, это означает, что Гонзага наберет 73,5 очка.
Вы можете сделать такой же расчет для другого матча. Предположим, что нападение штата Мичиган имеет рейтинг 111, а защита Гонзаги имеет рейтинг 93 (оба измерены в очках за 100 владений). Вы можете вычислить, что нападение штата Мичиган, по прогнозам, будет на 4 очка лучше на 100 владений мячом. Это означает 72,8 очка в игре с 70 владениями.
Основываясь на этих гипотетических числах, можно было бы спрогнозировать, что Гонзага выиграет с преимуществом 0,7 балла.
Хотя я предполагал, что в этой игре было 70 владений, вы можете предположить другое количество, особенно если Гонзага играет быстрее, чем в среднем. Этот метод дает полную свободу выбора темпа.
Получите мою шпаргалку по мартовскому безумию
В The Power Rank я использую данные и аналитику, чтобы делать более точные прогнозы на футбол и мартовское безумие.
Если вы подпишетесь на мою бесплатную рассылку новостей по электронной почте, вы получите:
- моя шпаргалка по мартовскому безумию, которая упрощает заполнение вашей скобки
- образец моих лучших прогнозов на футбол и баскетбол в колледже, которые обычно сохраняются для платящих членов The Power Rank
- обновления контента, подобного этому руководству по аналитике баскетбола в колледже
Чтобы зарегистрироваться, введите свой лучший адрес электронной почты и нажмите «Зарегистрироваться сейчас!»
2. Имеют ли значение матчи?
В сезоне 2019-2020 «Западная Вирджиния» была элитной атакующей командой по подбору. Напротив, Техас плохо справлялся с отскоком в защите, хуже всего в Большой 12.
Когда Западная Вирджиния играет с Техасом, есть ли у них преимущество в этом матче? Можем ли мы использовать это, чтобы сделать более точный прогноз?
Джордан Спербер из Hoop Vision отлично поработал над матчами. Чтобы понять его результаты, давайте рассмотрим четыре фактора баскетбола, которые предоставляют количественный метод анализа матчей.
2а. Четыре фактора
Дин Оливер был пионером в баскетбольной аналитике. В 2003 году он впервые опубликовал свою книгу « Баскетбол на бумаге» , заложившую основу для будущей работы в области баскетбольной аналитики.
В книге он задавался вопросом, какие факторы сделали преступление серьезным. Стрельба - очевидное преимущество, но что еще имеет значение? Оливер записал четыре фактора:
- стрельба
- наступательный подбор
- обороты
- добраться до штрафной линии
Давайте рассмотрим эти четыре фактора более подробно и то, как определить статистику скорости для каждого.
Первым из четырех факторов является бросок, так как нападение не может забить без забитых мячей. Самый простой способ измерения бросков - это процент заброшенных мячей или количество заброшенных мячей, разделенное на количество попыток.
Лучшая формула броска дает нападавшему больший счет для трехочкового броска. Эффективный процент бросков с игры дает дополнительные 50% за тройку. В студенческом баскетболе средний процент эффективных бросков с игры составляет около 50%.
Второй фактор - это подбор в нападении, так как нападение сохраняет владение мячом за счет подбора в нападении. Однако общие подборы в атаке не являются хорошей мерой, поскольку они зависят от точности бросков соперника.
Вместо этого учитывайте частоту подборов в нападении или долю подборов, полученных нападением на этом конце площадки. Этот коэффициент подборов в атаке представляет собой количество подборов в атаке, деленное на сумму подборов в атаке плюс подборы в защите соперника.
В студенческом баскетболе средний показатель подбора в атаке составляет около 28%. Так как защита захватывает другие подборы, коэффициент подбора в защите равен 1 минус коэффициент подбора соперника в нападении.
Третий фактор - это обороты. Команда не может забить, если перед выстрелом совершит переход.
Чтобы измерить обороты, рассмотрите коэффициент текучести, или обороты, разделенные на владения, как оценивается по шкале оценок. В среднем баскетбольные команды колледжей передают мяч примерно в 19% владений.
Последний фактор - добраться до линии фола. Поскольку средний процент штрафных бросков в студенческом баскетболе составляет 70%, выполнение двух попыток штрафных бросков является эффективным способом набрать очки.
Для измерения попадания в линию фола одним показателем является количество попыток штрафного броска, разделенное на количество попыток броска с игры. В студенческом баскетболе этот показатель составляет около 32%.
Это также разумно определить этот фактор , как свободный бросок сделал деленный на попытках цели поля. Это определение включает в себя возможность выполнять штрафные броски в дополнение к достижению линии фола. Однако я буду использовать попытки штрафных бросков, чтобы изолировать возможность добраться до линии фола.
Четыре фактора Оливера почти точно объясняют эффективность атаки или количество очков за владение мячом. Чтобы объяснить это, я провел линейную регрессию по четырем факторам, чтобы объяснить количество очков за владение мячом на уровне команды. В этом процессе каждому из четырех факторов присваивается вес.
Когда вы проводите этот анализ для студенческого баскетбола, четыре фактора объясняют 98% различий в эффективности атаки.
Основываясь на этом регрессионном анализе, какой из четырех факторов является наиболее важным? Стрельба - самый важный из четырех факторов, а не сюрприз. Подборы и потери в атаке имеют примерно такое же значение, но меньше, чем стрельба. Наименее важный фактор - добраться до линии фола.
2b. Крайности в матчапах
Учитывая эти четыре фактора, давайте вернемся к вопросу о том, важны ли совпадения для прогнозов. В 2013 году Джордан Спербер задавался вопросом, будет ли команда, отличившаяся по одному из четырех факторов, иметь преимущество перед противником, слабым по противоположному фактору.
В частности, можете ли вы делать более точные прогнозы, основываясь на превосходстве Западной Вирджинии в подборе в атаке и слабости Техаса в подборе в защите?
Чтобы изучить это, Спербер выделил игры, в которых у команд были крайности в подборе мяча. Он определил крайность как команду с верхними или нижними 10% по скорости подбора в атаке или защите.
И с элитными, и с ужасными юнитами есть четыре типа игр:
- элитное нападение против элитной защиты
- элитное нападение против ужасной защиты
- ужасное нападение против элитной защиты
- ужасное нападение против ужасной защиты.
Спербер изолировал игры с этими матчами и спросил, насколько хорошо отрегулированная эффективность атаки и защиты может сделать прогноз в каждой игре, как обсуждалось в предыдущем разделе. Он сравнил этот прогноз с реальной эффективностью игры.
Например, в его наборе данных было 311 игр с элитной атакующей командой по подбору против ужасной команды по подбору в защите. Если сравнивать прогноз эффективности с реальной эффективностью игры, то средняя разница составила менее одного очка на 100 владений.
Прогноз, основанный на эффективности атаки и защиты, смог объяснить исход этих игр. Вот главный результат его исследования: Спербер обнаружил одинаковую точность прогнозов во всех четырех типах матчей.
Он повторил исследование трех других факторов и получил тот же результат. Прогноз эффективности был одинаково точным в каждом из четырех типов матчей.
Вот главный вывод: матчи командного уровня по четырем факторам не помогают предсказать исход баскетбольного матча колледжа. В каком-то смысле матч уже учитывается в показателях эффективности. Вы можете видеть это по тому, насколько хорошо четыре фактора объясняют эффективность.
Не экстраполируйте эти результаты слишком далеко. Если ваша команда играет центрового размером шесть футов три дюйма, его, вероятно, убьет Джоэл Эмбиид. Однако, исходя из четырех факторов, совпадения не помогут вам делать более точные прогнозы. Эффективность в атаке и защите с поправкой на количество очков за владение отлично справляется.
3. Дальнейшее чтение
Нужна дополнительная аналитика по баскетболу в колледже? Ознакомьтесь с этими ресурсами для дальнейшего чтения.
3а. Трехочковый выстрел
Трехочковый выстрел - мощное оружие. Это дает проигравшему возможность разгорячиться и снять расстройство. Он также продвинул такого фаворита, как Вилланова, к двум чемпионатам NCAA.
Кен Помрой задался вопросом, контролирует ли нападение или защита трехочковый бросок. Чтобы изучить это, он на конференции посмотрел на корреляцию между статистикой в начале и в конце сезона.
Он обнаружил, что у защиты есть возможность контролировать, какие виды ударов будет делать противник. Защита может ограничить количество ударов, которые делает противник, до трех.
Однако защита теряет контроль, если атакующий наносит трехочковый бросок. Случайность играет большую роль в определении допустимых трех баллов.
Что еще более удивительно, случайность также играет большую роль в трехбалльном проценте нарушения. Хотя стрельба - это очевидный навык, данные показывают регресс к среднему значению в трех процентах.
Чтобы прочитать статью Помероя о трехбалльной лотерее, щелкните здесь.
Я также посмотрел на случайность трехочковых бросков для игроков НБА. Чтобы ознакомиться с этим исследованием, нажмите здесь.
3b. Ансамблевые методы прогнозирования турнира
Нейт Сильвер опубликовал прогнозы на турнир NCAA как в New York Times, так и на своем собственном сайте FiveThirtyEight. Ключ к точным прогнозам - это ансамблевые методы, сочетающие множество предикторов.
Во-первых, Silver объединяет 6 различных рейтингов мощности, чтобы оценить силу команды. У каждой системы есть свои слабые стороны, но комбинация дает мощный предсказатель.
Вдобавок Сильвер добавляет неожиданный компонент: предсезонный опрос AP. Может показаться странным добавить предсказатель, у которого нет доступа к данным за текущий сезон.
Тем не менее, предсезонный опрос AP - мощный инструмент для прогнозирования результатов турнира, использующий мудрость толпы. Ни один спортивный обозреватель не представит идеального бюллетеня, но совокупность многих спортивных обозревателей дает точную оценку силы команды.
Фактически, моя статья о FiveThirtyEight показала, что предсезонный опрос является лучшим предсказателем, чем RPI, устаревший вычислительный метод, который отборочная комиссия ранее использовала для заполнения поля.
Предыдущая статья об этих прогнозах турниров NCAA вдохновила меня на ансамблевой подход, который я использую для прогнозов моих участников в The Power Rank. Это включает в себя американский футбол и НФЛ в дополнение к студенческому баскетболу.
Чтобы узнать о методах прогнозов Нейта Сильвера на турниры NCAA, щелкните здесь.
3c. Как выиграть пул мартовского безумия
Вооружившись аналитикой и вероятностями выигрыша, вы готовы выиграть свой пул March Madness. Однако вам не следует просто выбирать команду с более высоким рейтингом в каждой игре.
Эта стратегия фаворитов дает вам самую высокую вероятность выигрыша для небольших пулов. Но в некоторые годы есть более оптимальная стратегия для бассейнов среднего размера.
Иногда публику вызывает чрезмерное возбуждение по поводу команды, такой как команда Кентукки 2015 года, которая вышла на турнир непобежденной. Как показывают цифры, предположим, что вы также выбрали эту команду в качестве чемпиона.
Если этот фаворит победит, вы и многие другие получите 32 очка за выбор правильного чемпиона. С таким количеством игроков в разногласиях вполне вероятно, что кому-то повезет в более ранних раундах и кто-то победит вас.
Вместо этого вам следует сделать противоположный выбор другой команды с высокой вероятностью выигрыша, но не быть выбранным во многих пулах. Если эта команда выиграет, у вас будет отличный шанс выиграть свой пул.
Я объясняю эти идеи в своей книге « Как выиграть турнирный фонд NCAA» . Я разместил введение здесь, в рейтинге силы. Чтобы просмотреть всю книгу по цене ниже латте, нажмите здесь.
Получите мою шпаргалку по мартовскому безумию
В The Power Rank я использую данные и аналитику, чтобы делать более точные прогнозы на футбол и мартовское безумие.
Если вы подпишетесь на мою бесплатную рассылку новостей по электронной почте, вы получите:
- моя шпаргалка по мартовскому безумию, которая упрощает заполнение вашей скобки
- образец моих лучших прогнозов на футбол и баскетбол в колледже, которые обычно сохраняются для платящих членов The Power Rank
- обновления контента, подобного этому руководству по аналитике баскетбола в колледже
Чтобы зарегистрироваться, введите свой лучший адрес электронной почты и нажмите «Зарегистрироваться сейчас!»
Популярные слоты
