Огромный склад приватных материалов
Крупнейшая база обучающих инфопродуктовв сети. Более 50000 редких курсов, вебинаров, тренингов, мануалов, схем заработка, книг
Открыть доступ

Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive [bigdata team]

Bot

Администратор
Команда форума
Регистрация
23 Янв 2020
Сообщения
135,340
Реакции
342
Баллы
83
ЧАСТЬ 1 - HDFS (ВЫ ТУТ) || ЧАСТЬ 2 - Spark || ЧАСТЬ 3 - Kafka, RT, NoSQL, Data layout
Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.

Часть 1.
HDFS, Map Reduce, Hive

В этом модуле вы изучите:

▶ вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
▶ распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
▶ чтение и запись в HDFS. HDFS APIs: Web, shell.
▶ Hadoop Streaming;
▶ элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
▶ приложения с несколькими Hadoop-задачами;
▶ тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
▶ задачи с несколькими входами. Joins в Hadoop.
▶ архитектура Hive, виды таблиц, форматы хранения данных;
▶ трансляция Hive-запросов в MapReduce-задачи;
▶ сериализация и десериализация;
▶ тюнинг Join'ов в Hive;
▶ партиционирование, бакетирование, семплирование;
▶ User defined functions, Hive Streaming.

Продажник: bigdatateam.org/ru/big-data-course
 

О нас

  • Ресурс посвященный информационным продуктам. Курсы, тренинги, книги, уроки, гайды, материалы на различные тематики.

Меню