Перейти на главную | Список курсов | Расписание | Заявка на курс | Cisco course on-line registration

Наши контакты

☎ +7 747 716 2122 ☎ +7 777 241 7298
☎ +7 747 592 9208
asem@ciscotrain.kz info@ciscotrain.kz
gulzifa@ciscotrain.kz

Схема проезда

Гоголя 39, каб. 509
Казахстан, г. Алматы, ул. Гоголя 39, каб. 509, 050002

Аналитика больших данных для руководителей

24

       Данный курс предоставляет базовые знания необходимые для участия в проектах по анализу больших данных. Включает информацию о фазах жизненного цикла процессов аналитики больших данных при переходе бизнеса к использованию Big Data. Материал курса обеспечивает слушателей знанием базовых и расширенных аналитических методов и техник, применяемых для поиска и извлечения знаний  из больших массивов разнородных данных. Сравнение различных версий дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики данных, "open source" и коммерческие инструменты используемые для хранения, обработки, визуализации и аналитики больших данных.

            Аудитория

Данный курс предназначен для руководителей, менеджеров и специалистов желающих получить дополнительные знания по  инструментам и методам анализа больших данных для участия в проектах больших данных.

Содержание курса

1.    Введение в Big Data(Большие данные)

Большие данные и цифровая трансформация. Методы аналитики больших данных. Отраслевая         специфика аналитики больших данных.  Жизненный цикл аналитики данных: Получение данных.       подготовка данных, планирование модели, построение модели, проверка результатов, внедрение.

2. Data Mining  - извлечение знаний из больших данных

Задачи Data Mining. Техники Data Mining. Классификация и кластеризация. Прогнозирование и визуализация. Ассоциативные правила и обнаружение аномалий. Методология CRISP-DM. Инструменты Data Mining. Специфика применения Data Mining для разных отраслей бизнеса с примерами.

3. Машинное обучение для Data mining

Основные определения. Задачи и область применения машинного обучения. Supervised/unsupervised машинное обучение. Инструменты и технологии машинного обучения.

4.  Data mining в социальных сетях

Введение в анализ социальных сетей и теорию графов. Базовые алгоритмы на графах и основные возможности графового анализа. Феномен маленького мира. Выделение важных узлов в социальных сетях. Инструменты и методы визуализации графов для применения в бизнесе.

5. Инструментарий для работы с Big Data

Специфика работы с Big Data. Аналитика для неструктурированнных данных - Hadoop и MapReduce. Функционал и особенности MapReduce. Назначение и характеристика компонент экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, Hive,  и т.д.). Сравнительный анализ Hadoop дистрибутивов (Cloudera, Horton Works, MapR) и инструментария аналитика данных на примерах использования. Сравнительные характеристики программных и аппартных решений для реализации решений по Big Data. Облачные платформы (AWS, EMR, Azure) для реализации решений по Big Data. Средства визуализации для аналитики данных.

6. Интеграция Больших данных

Основные принципы работы с Big Data. Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети). Пакетная и динамическая загрузка данных. Использование Data Management Platform (Платформа управления данными).

7. Правовые аспекты организации защиты персональных данных

Правовое регулирование в области защиты персональных данных. Международная практика в области защиты персональных данных. Права субъекта и обязанности оператора при обработке персональных данных. Виды нарушений безопасности персональных данных.

8. С чего начать?

Формирование команды проекта Big Data. Ключевые роли. Отличия подходов Business Intelligence и Data Science. Специфика рынка данных и аналитики.

 
Примечание: Для 16 часового онлайн курса предусмотренны варианты практических работ (дополнительные 6 часов), выполняемых под руководством преподавателя на компьютерах слушателей и в облачных сервисах Amazon Web Services в третий день курса. Слушатели должны иметь возможность установить дополнительное программное обеспечение для успешного выполнения лабораторных работ. Пробные версии дистрибутивов и учетные записи для облачных сервисов предоставляются учебным центром на время практических занятий.

 Подходит? Подать заявку на этот курс