About this Course
4.7
1,065개의 평가
108개의 리뷰

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

탄력적인 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

완료하는 데 약 25시간 필요

권장: 4 недели обучения, через 3-5 часа / неделю...

러시아어

자막: 러시아어

귀하가 습득할 기술

Topic ModelData Clustering AlgorithmsMachine LearningData Visualization (DataViz)

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

탄력적인 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

완료하는 데 약 25시간 필요

권장: 4 недели обучения, через 3-5 часа / неделю...

러시아어

자막: 러시아어

강의 계획 - 이 강좌에서 배울 내용

1
완료하는 데 7시간 필요

Кластеризация

Добро пожаловать на курс "Поиск структуры в данных"! В этом курсе вы узнаете про задачи машинного обучения, в которых требуется не предсказать целевую переменную, а найти некоторые внутренние закономерности в данных — например, сгруппировать объекты по схожести, или определить наиболее важные признаки. В первом модуле мы изучим задачу кластеризации, направленную на поиск групп близких объектов. Вы узнаете про основные подходы к её решению, а также узнаете, как можно выбрать хороший алгоритм кластеризации, не имея правильных ответов....
15 videos (Total 109 min), 8 readings, 5 quizzes
15개의 동영상
Как устроена специализация, и зачем ее проходить3m
Структура уроков1m
Задача кластеризации4m
Примеры задач кластеризации5m
Знакомство с методами кластеризации9m
Пример: кластеризация текстов по теме13m
Выбор метода кластеризации7m
МФТИ1m
Метод K средних (K-Means)10m
Expectation Maximization (EM-алгоритм)9m
Агломеративная иерархическая кластеризация12m
Графовые методы кластеризации4m
Методы, основанные на плотности6m
Оценка качества и рекомендации по решению задачи кластеризации13m
8개의 읽기 자료
Блокнот из примера кластеризации текстов20m
Слайды к лекциям10m
Конспект10m
Немного о Yandex10m
МФТИ10m
Forum&Chat10m
Слайды к лекциям10m
Конспект10m
4개 연습문제
Знакомство с кластеризацией6m
Введение в кластеризацию8m
Некоторые методы кластеризации8m
Подробнее о методах кластеризации12m
2
완료하는 데 6시간 필요

Понижение размерности и матричные разложения

В предыдущем модуле мы обсуждали, как кластеризовать объекты, а в этом модуле займёмся признаками. Нередко возникают ситуации, в которых далеко не все признаки нужны для решения задачи — или же нужны все, но при этом их слишком много. В этом случае нужно перейти в новое признаковое пространство меньшей размерности. Для этого можно либо отбирать наиболее важные признаки, либо порождать новые на основе исходных — мы обсудим оба подхода. В частности, мы разберёмся с методом главных компонент, который используется в самых разных задачах машинного обучения. Затем мы перейдём к матричным разложениям — мы изучим несколько методов, позволяющих получить приближение исходной матрицы в виде произведения нескольких матриц меньшей размерности. Такая аппроксимация часто используется в задачах машинного обучения, например, для понижения размерности данных, восстановления пропущенных значений в матрицах и построения рекомендательных систем....
15 videos (Total 108 min), 4 readings, 5 quizzes
15개의 동영상
Одномерный отбор признаков8m
Жадные методы отбора признаков6m
Отбор признаков на основе моделей6m
Понижение размерности4m
Метод главных компонент: постановка задачи7m
Метод главных компонент: решение6m
Матричные разложения13m
SGD и ALS5m
Прогнозирование неизвестных значений в матрице6m
Проблема отсутствия негативных примеров и implicit методы6m
Вероятностный взгляд на матричные разложения5m
Неотрицательные матричные разложения: постановка и решение10m
Неотрицательные матричные разложения: функционалы и инициализация5m
Обработка пропусков8m
4개의 읽기 자료
Слайды к лекциям10m
Конспект10m
Слайды к лекциям10m
Конспект10m
4개 연습문제
Отбор признаков6m
Понижение размерности и отбор признаков14m
Матричные разложения8m
Неотрицательные матричные разложения10m
3
완료하는 데 4시간 필요

Визуализация и поиск аномалий

Добро пожаловать на третью неделю курса! В ней мы обсудим две задачи: обнаружение аномалий и визуализация данных. Обнаружение аномалий направлено на поиск объектов, которые являются особенными в некотором смысле. Например, это могут объекты с такими значениями признаков, которые далеки от имеющихся в обучающей выборке — вполне ожидаемо, что на таких объектах модель выдаст очень плохие прогнозы. Вы узнаете, как можно формально дать определение аномалий и с помощью каких методов можно решать задачу их поиска. Вторая задача, о которой мы поговорим — это визуализация, то есть отображение многомерной выборки в пространство размерности два или три. В теории визуализация близка к понижению размерности — но за счёт того, что нам нужно найти всего два или три признака, можно использовать очень сложные нелинейные методы....
8 videos (Total 57 min), 5 readings, 5 quizzes
8개의 동영상
Параметрическое восстановление плотности9m
Непараметрическое восстановление плотности8m
Одноклассовый SVM5m
Задача визуализации5m
Многомерное шкалирование4m
Метод t-SNE6m
Визуализация данных в sklearn12m
5개의 읽기 자료
Слайды к лекциям10m
Конспект10m
Визуализация данных в sklearn10m
Слайды к лекциям10m
Конспект10m
4개 연습문제
Восстановление плотности6m
Поиск аномалий4m
Методы SNE и t-SNE6m
Визуализация14m
4
완료하는 데 10시간 필요

Тематическое моделирование

Люди уже много веков сохраняют свои знания в виде книг, а крупнейшая на сегодняшний день коллекция информации — Интернет — состоит из огромного количества текстов. Тексты, по сути, являются наиболее популярным видом данных, и поэтому очень важно уметь искать в них закономерности. Тематическое моделирование — это способ семантического анализа коллекции текстовых документов. Тематическая модель позволяет для каждого документа найти темы, которые его описывают, и кроме того показывает, какие слова характеризуют ту или иную тему. Другими словами, мы находим более компактное представление большого набора текстов в виде нескольких тем. С математической точки зрения тематическая модель — это еще один вид матричного разложения, где в качестве исходной матрицы выступает матрица частот слов в документах. На четвертой неделе мы поговорим о том, где применяют тематические модели, какие они бывают, как их строить и как оценивать. ...
14 videos (Total 151 min), 8 readings, 6 quizzes
14개의 동영상
Постановка задачи тематического моделирования12m
Базовые тематические модели и EM-алгоритм14m
Регуляризация тематических моделей10m
Мультимодальные тематические модели9m
Внутренние критерии качества тематических моделей9m
Внешние критерии качества тематических моделей16m
Визуализация тематических моделей10m
Тематические модели на практике11m
Пример использования библиотеки gensim для построения тематической модели10m
Установка BigARTM в Windows3m
Установка BigARTM в Linux Mint2m
Установка BigARTM в Mac OS-X3m
Пример использования библиотеки BigARTM для построения тематической модели19m
8개의 읽기 자료
Слайды к лекциям10m
Конспект10m
Ноутбук из демонстрации использования gensim10m
Ноутбук из демонстрации использования BigARTM10m
Слайды к лекциям10m
Конспект10m
Финальные титры10m
Стань ментором специализации10m
4개 연습문제
Постановка задачи и базовые понятия6m
Тематическое моделирование-18m
Критерии качества тематических моделей6m
Тематическое моделирование-26m
4.7
108개의 리뷰Chevron Right

71%

이 강좌를 수료한 후 새로운 경력 시작하기

56%

이 강좌를 통해 확실한 경력상 이점 얻기

25%

급여 인상 또는 승진하기

최상위 리뷰

대학: PKMay 4th 2018

Отличный вводный курс, как и вся специализация. Доступно и понятно изложены все базовые вещи, которые могут потребоваться в повседневной деятельности в качестве data scientist.

대학: AAJan 9th 2017

Интересный курс, замечательные преподаватели. Есть моменты когда лекция довольно сложная, а тест простой, это оставляет тревожное ощущение недоученности :)

강사

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

모스크바 물리 기술원 정보

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

Yandex 정보

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Машинное обучение и анализ данных 전문 분야 정보

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

자주 묻는 질문

  • 강좌에 등록하면 바로 모든 비디오, 테스트 및 프로그래밍 과제(해당하는 경우)에 접근할 수 있습니다. 상호 첨삭 과제는 이 세션이 시작된 경우에만 제출하고 검토할 수 있습니다. 강좌를 구매하지 않고 살펴보기만 하면 특정 과제에 접근하지 못할 수 있습니다.

  • 강좌를 등록하면 전문 분야의 모든 강좌에 접근할 수 있고 강좌를 완료하면 수료증을 취득할 수 있습니다. 전자 수료증이 성취도 페이지에 추가되며 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 내용만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.