Просто о статистике (с использованием R) 특화 과정
Освойте основы анализа данных в R. Вы пройдете путь от базовой статистики до продвинутых линейных моделей
제공자:
배울 내용
Создавать скрипты для анализа данных на языке R
Моделировать зависимости между величинами при помощи общих, обобщенных и смешанных линейных моделей
Выбирать подходящие методы анализа в зависимости от свойств данных и с учетом дизайна сбора материала
Создавать автоматизированные отчеты о результатах статистического анализа, используя rmarkdown/knitr
귀하가 습득할 기술
이 전문 분야 정보
응용 학습 프로젝트
Каждый из курсов заканчивается практическим проектом, так что к концу специализации вы сможете собрать портфолио из разных видов анализа данных. Отчеты по проекту, выдержанные в традиции воспроизводимых исследований, вы научитесь создавать, не покидая R, при помощи пакетов knitr / rmarkdown.
Специальной подготовки не требуется. Знание математики в рамках школьной программы.
Специальной подготовки не требуется. Знание математики в рамках школьной программы.
이 전문 분야에는 5개의 강좌가 있습니다.
Знакомство с R и базовая статистика
Статистическая обработка данных и визуализация результатов анализа - это неизбежный этап работы с данными, полученными в различных областях естественных наук, в социологии, психологии или экономике. В этом курсе мы подробно разберем основы статистики и познакомимся с основами языка статистического программирования R. Мы научим вас гибко использовать средства визуализации (диаграммы, графики и т.п.), чтобы сделать результаты анализа максимально доступными и понятными. Вы научитесь рассчитывать основные описательные статистики: медиану и квантили, среднее и стандартное отклонение. Вы познакомитесь с принципами использования теоретических распределений статистик для построения доверительных интервалов и тестирования гипотез (на примере t-критерия). Наконец, мы обсудим сложности, возникающие при множественном тестировании гипотез и научим вас преодолевать их.
Линейная регрессия
В этом курсе мы разберем основные методы описания взаимосвязей между количественными признаками. Если корреляционный анализ позволяет количественно оценить силу и направление связи между двумя величинами, то построение регрессионных моделей дает более широкие возможности. При помощи регрессионного анализа можно количественно описывать поведение изучаемых величин в зависимости от переменных-предикторов и получать предсказания на новых данных. Вы узнаете, как строить простые и множественные линейные модели с использованием языка R. У всякого метода есть свои ограничения, поэтому мы поможем вам разобраться, в каких ситуациях можно, а в каких нельзя применять линейную регрессию, и научим вас методам диагностики подобранных моделей. Специальное место в курсе отводится глубинной анатомии регрессионного анализа: вы освоите операции с матрицами, которые лежат в основе линейной регрессии, чтобы получить возможность разбираться в более сложных разновидностях линейных моделей.
Линейные модели с дискретными предикторами
Необходимость описать закономерности изменения количественной переменной в нескольких группах возникает часто, например, если перед вами данные эксперимента. Дисперсионный анализ - это один из методов, который позволяет эффективно решать такие задачи, особенно, если таких групп больше чем две (однофакторный дисперсионный анализ), или группировка задается несколькими факторами (многофакторный дисперсионный анализ). В этом курсе вы узнаете, что в рамках парадигмы линейных моделей вполне можно работать не только с непрерывными, но и с дискретными предикторами - а иногда это даже приходится делать одновременно (как в ковариационном анализе и др.). Мы разберем несколько вариантов представления дискретных предикторов в линейных моделях и последствия разных способов кодирования для интерпретации модели. Вы научитесь подбирать линейные модели со взаимодействием факторов, чтобы описывать ситуации, когда характер действия фактора меняется в разных группах. В этом курсе для анализа и визуализации линейных моделей мы будем использовать язык статистического программирования R. Его богатейшие возможности позволят вам разобраться в тонкостях внутреннего устройства линейных моделей с дискретными и непрерывными предикторами.
Обобщенные линейные модели
Результаты подсчета чего-либо или вероятности возникновения событий - это величины, практически не поддающиеся моделированию при помощи обычных линейных моделей, так как не подчиняются нормальному распределению. Обобщенные линейные модели (Generalized Linear Models, GLM) позволяют обойти это ограничение. В этом курсе мы постараемся с минимальным количеством математики рассказать об устройстве GLM и многочисленных подводных камнях, связанных с анализом. GLM для счетных данных основаны на распределении Пуассона или отрицательном биномиальном распределении. Модели для бинарных данных (например, логистическая регрессия) - на биномиальном распределении. Мы обсудим особенности диагностики моделей, возникающие в зависимости от выбранного распределения. Параметры GLM подбирают при помощи метода максимального правдоподобия, поэтому и аппарат тестирования гипотез и техники упрощения моделей довольно сильно отличаются от привычного для простых линейных моделей. Для анализа данных мы будем использовать язык R, чтобы вы могли лучше разобраться в тонкостях работы с обобщенными линейными моделями. Вас ждут интерактивные задания на платформе Stepic и проект по анализу данных в конце курса.
제공자:

상트 페테르부르크 주립 대학교
Санкт-Петербургский государственный университет (СПбГУ) — старейший вуз России, основанный в 1724 году. Университет сегодня — научный, образовательный и культурный центр мирового значения, неизменно входящий во все международные рейтинги вузов. В номинации взаимодействие с работодателями QS Graduate Employability 2018 СПбГУ занимает 20 место среди 400 ведущих вузов мира и является лучшим в России.
자주 묻는 질문
환불 규정은 어떻게 되나요?
하나의 강좌에만 등록할 수 있나요?
재정 지원을 받을 수 있나요?
해당 강좌를 무료로 수강할 수 있나요?
이 강좌는 100% 온라인으로 진행되나요? 직접 참석해야 하는 수업이 있나요?
전문 분야를 완료하면 대학 학점을 받을 수 있나요?
궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.