Статистика работает с данными. Имея на руках информацию о выборке, мы хотим строить какие-то выводы о том, что происходит в генеральной совокупности. Вопросы, на которые отвечает статистика, бывает двух сортов. Мы можем захотеть оценить значение параметров генеральной совокупности, и мы о такого рода задачах говорили в прошлом модуле. В этом модуле речь пойдет о задачах совершенно другого сорта, о том случае, когда мы хотим сравнить значение параметров в разных генеральных совокупностях, в разных выборках, когда мы хотим выяснить, есть ли эффект есть ли различия, и на вопросы такого рода помогает отвечать тестирование гипотез. Алгоритм тестирования гипотез выглядит в общем виде примерно одинаково для любого теста. Вначале мы должны сформулировать эти самые гипотезы. Гипотезы - это обычно два каких-то не совместных утверждения, наши прогнозы о том, что может быть, какие варианты событий могут быть. После этого нам нужно перевести гипотезы на язык математики и сформулировать статистику, при помощи которой мы сможем ее протестировать. Хорошо бы, чтобы у этой статистики было какое-то теоретическое распределение. Мы построим теоретическое распределение для того случая, когда верна нулевая гипотеза и вычисленная для наших данных значений и статистики будем сравнивать с этим теоретическим. На основании этого сравнения мы потом сможем принять решение о судьбе нулевой гипотезы: принять ее или отвергнуть. Как формулируется гипотеза? Нулевая и альтернативная гипотеза, они должны описывать взаимоисключающие варианты развития событий. Нулевая гипотеза обычно формулируется так, что различий нет. Например, мы можем сказать, что при предъявлении баннеров с разным дизайном, количество переходов по ним будет одинаковое, это будет нулевая гипотеза. Или мы можем сказать, что вне зависимости от того, сколько времени спали в предыдущую ночь люди, восемь часов или два часа, они сделают примерно одинаковое количество отпечаток на следующее утро в тексте одинаковой длины. Альтернативная гипотеза будет формулироваться немножко сложнее, потому что альтернативные гипотезы бывают двух сортов: бывают двусторонние и бывают односторонние. Двусторонние альтернативные гипотезы, они подчеркивают вообще отсутствие различий. Нам не важен знак различий, важно, что выборки наши отличаются, что две ситуации отличаются. Например, мы можем сказать, что варианты рекламных баннеров, они дадут разное количество переходов. Это будет двусторонняя альтернативная гипотеза, или просто, не уточняя больше или меньше будет опечаток, мы можем сказать, что люди, которые спали разное количество времени, сделают разное количество опечаток. Эти ключевые слова просто подчеркивают наличие различий, но не акцентируют внимание на их направлении. Односторонние альтернативные гипотезы наоборот, там все ключевые слова будут содержать информацию о направлении различий. Например, мы можем считать, что вот вариант дизайна В, он даст большее количество переходов, это будет односторонней альтернативной гипотезой. Или мы можем с уверенностью, почти что предположить, что люди, которые спали меньше, они сделают больше опечаток на следующее утро. Формулировку альтернативной гипотезы мы обычно придумываем заранее. Фактически, альтернативная гипотеза, она описывает наш исследовательский вопрос, это то, с чего начинается любое исследование, а потом нам уже на ее основе приходится конструировать нулевую гипотезу, но нулевые гипотезы всегда выглядят одинаково. Дальше наша задача - принять решение о том, какую гипотезу нам нужно оставить, а какую гипотезу отвергнуть, и здесь есть одна закавыка, потому что фриквентистская статистика традиционно не позволяет нам выяснить, действительно ли верна нулевая гипотеза или действительно ли она неверна. Мы можем всего лишь взвесить те данные, которые свидетельствуют в пользу нулевой гипотезы, и если они недостаточно сильны свидетельствуют, мы ее отвергает. Но мы так и не узнаем, правда это или нет. В этом модуле, на примере работы с t-статистикой, мы с вами рассмотрим, как выглядят алгоритмы тестирования гипотез и потренируемся. Возможно, все, что сейчас я сказала, станет гораздо понятнее, когда у вас появится практика.