Перейти на главную | Список курсов | Расписание | Заявка на курс | Cisco course on-line registration

Наши контакты

☎ +7 747 716 2122 ☎ +7 777 241 7298
☎ +7 747 592 9208
asem@ciscotrain.kz info@ciscotrain.kz
gulzifa@ciscotrain.kz

Схема проезда

Гоголя 39, каб. 509
Казахстан, г. Алматы, ул. Гоголя 39, каб. 509, 050002

Анализ данных, визуализация и моделирование R/Data Analysis, Visualization and modeling in R

40

         Данный курс является необходимым  для получения практических навыков работы с R и R-Studio. Вы узнаете, как загружать, сохранять и преобразовывать данные, а также как писать функции, создавать графики и cопоставлять базовые статистические модели с данными. В дополнение к теоретическим основам, в которых вы изучите процесс анализа данных, этот курс фокусируется на практических инструментах, необходимых для анализа и визуализации больших данных. По окончанию курса вы овладеете основными навыками обработки, манипулирования и анализа данных различных типов,  создания отчетов и документирования вашего кода.

 Аудитория

Специалисты по работе с большими данными, бизнес аналитики и руководители желающие получить расширенную  теоретическую и практическую подготовку по использованию R-Studio в проектах анализа больших данных

Предварительная подготовка

·         Понимание основ статистики

·         Опыт работы c R-Studio  или  знание в рамках курса DataScience-DataAnalysis & Visualization: Data Science: Анализ данных и визуализация в R (ссылка)

Содержание курса

1. Основы статистики и простая линейная регрессия

Что такое ваши данные. Статистические выводы. Введение в машинное обучение. Простая линейная регрессия. Диагностика и трансформация. Коэффициент определенности

 2. Базовое программирование с R

Введение в R. Что такое R? RStudio, пакеты и рабочая область Основные элементы языка R. Типы объектов данных. Локальный импорт / экспорт данных.Введение функций и управляющих операторов. Углубленное изучение объектов данных. Функции. Программирование функций.

3. Базовые элементы данных

Преобразование данных(Reshape,Split,Combine)

Символы. Обработка строк. Даты и временные метки.

Сбор Веб-данных. API источники данных. Подключение к внешней базе данных.

4. Манипулирование данными с помощью "dplyr"

Подмножество, преобразование и переупорядочение наборов данных.

Объединение наборов данных. Групповые операции над наборами данных.

5. Графика данных и визуализация данных

Основные подходы к визуализации данных и графики данных. Base,Grid,Lattice,ggplot2

Построение графиков больших данных с ggplot2

6. Расширенная визуализация в R

Настраиваемая графика с помощью ggplot2. Титулы, системы координат, масштабы, темы, метки,легенда,scatterplot с многоразмерными данными,визуализация временной последовательности, карты. Интерактивная визуализация в R.

 Подходит? Подать заявку на этот курс