Перейти на главную | Список курсов | Расписание | Заявка на курс | Cisco course on-line registration

Наши контакты

☎ +7 747 716 2122 ☎ +7 777 241 7298
☎ +7 747 592 9208
asem@ciscotrain.kz info@ciscotrain.kz
gulzifa@ciscotrain.kz

Схема проезда

Гоголя 39, каб. 509
Казахстан, г. Алматы, ул. Гоголя 39, каб. 509, 050002

Data Science: Машинное обучение в R / Data Science: Machine Learning in R

40
11 - 15.05.2020

        Данный курс предназначен для изучения  алгоритмов машинного обучения с практическим применением техник машинного обучения реализованных в R. Рассматриваются понятия data mining, измерения производительности и уменьшения размерности, регрессионные модели, байессовская модель, SVM и ассоциативные правила для анализа. После успешного завершения данного курса вы сможете понимать  и объяснять принципы работы алгоритмов машинного обучение , и применять данные алгоритмы на реальных задачах в больших данных.

Аудитория

Специалисты по работе с большими данными, бизнес аналитики и руководители желающие получить расширенную  теоретическую и практическую подготовку по методам Data Mining для участия в проектах анализа больших данных

Предварительная подготовка

·         Понимание основ статистики

·         Опыт работы c R-Studio  или  знание в рамках курса DataScience-DataAnalysis & Visualization: Data Science: Анализ данных и визуализация в R (ссылка)

Содержание курса

Программа

1. Основы статистики и простая линейная регрессия

Что такое ваши данные. Статистические выводы. Введение в машинное обучение. Простая линейная регрессия. Диагностика и трансформация. Коэффициент определенности

2. Множественная линейная регрессия и обобщенная линейная модель

Множественная линейная регрессия. Допущения и диагностика. Обобщенные линейные модели. Логистическая регрессия. Оценка максимального правдоподобия. Интерпретация модели. Оценка соответствия модели.

3. Алгоритм ближайших соседей, наивный байессовский анализ и "проклятие размерности"

Алгоритм K-ближайших соседей. Выбор К и меры расстояния. Условная вероятность: теорема Байеса.

Оценка Лапласа. Уменьшение размерности. Процедура PCA. Ridge и регрессия Лассо. Перекрестная проверка.

4. Метод опорных векторов и модели деревьев

Деревья решений. Bagging. Случайные леса. Boosting. Важность переменной. Сортировка полей и поддержка векторного классификатора. Метод опорных векторов.

5. Кластерный анализ и нейронные сети

Кластерный анализ. K-means кластеризация. Иерархическая кластеризация. Нейронные сети и персептроны

Сигмоидные нейроны. Сетевая топология и скрытые функции. Метод обратного распространения ошибки с градиентным спуском.

 Подходит? Подать заявку на этот курс