Статистические методы обработки данных
Лекции: | Петр Сатунин |
Дмитрий Кирпичников | |
Владислав Баринов |
План курса
1. Понятие вероятности. Понятие случайной величины. Дискретные и непрерывные функции распределения случайных величин. Функции плотности вероятности случайных величин. Основные свойства. Примеры распределений: биномиальное, распределения Пуассона и Гаусса. Центральная предельная теорема (без вывода)2. Распределение Хи-квадрат. Свойства распределения Хи-квадрат. Связь распределения Хи-квадрат со статистикой. Проверка гипотез. Тест Пирсона (критерий хи-квадрат). P-value. Интерпретация p-value в рамках частотного подхода. Уровни значимости. Доверительные интервалы. Z-статистика. Число степеней свободы.
3. Теория оценок. Точечные оценки. Оценка неизвестного параметра модели по набору данных. Критерии оценки: несмещенность, эффективность. Примеры смещённых оценок. Несмещённая оценка для дисперсии. Понятие функции правдоподобия (Likelihood). Неравенство Крамера-Рао. Оценка по методу максимального правдоподобия, примеры для случая одного неизвестного параметра.
4. Связь метода максимального правдоподобия с распределением Хи-квадрат. Матричное представление. Ковариационная матрица. Оценки неопределенностей параметров модели. Дельта Хи2. Оценка дисперсии параметров модели методом вторых производных. Построение доверительных интервалов через likelihood scan метод. Число степеней свободы и уровни значимости.
5. Практическое занятие: Введение в пакет iMinuit, решение простых задач с его помощью.
6. Зависимость измерений. Систематические ошибки. Аддитивные и мультипликативные. Корреляции. Оценка ковариационной матрицы в случае коррелированных ошибок. Несимметричные ошибки измерений.
7. Проверка гипотез. Нулевая гипотеза, альтернативная гипотеза. Лемма Неймана-Пирсона, критический регион. Ошибки первого и второго рода. Z-тест. Тест относительно среднего совокупности для пропорций в частотном подходе.
8. Байесовский и частотный подход в статистике, отличия для задач проверки гипотез и теории оценок. Построение исключенных областей пространства параметров в моделях новой физики. Оценка параметров распределения Пуассона в случае нулевого фона в частотном и байесовском подходе.
9. Теорема Вилкса. Проверка гипотез при наличии связей между параметрами. Применение к задаче выделения сигнала из фона (на примере распределения Пуассона). Статистическая значимость сигнала при наличии фона.
Литература
- R.J.Barlow. Practical statistics for particle physics. arXiv: 1905.12362
- Битюков С. И., Красников Н. В. Применение статистических методов для поиска новой физики на Большом адронном коллайдере. М.: 2014