Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive [bigdata team]

Bot · 5 Май 2023

ЧАСТЬ 1 - HDFS (ВЫ ТУТ) || ЧАСТЬ 2 - Spark || ЧАСТЬ 3 - Kafka, RT, NoSQL, Data layout
Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.

Часть 1.
HDFS, Map Reduce, Hive

В этом модуле вы изучите:

▶ вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
▶ распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
▶ чтение и запись в HDFS. HDFS APIs: Web, shell.
▶ Hadoop Streaming;
▶ элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
▶ приложения с несколькими Hadoop-задачами;
▶ тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
▶ задачи с несколькими входами. Joins в Hadoop.
▶ архитектура Hive, виды таблиц, форматы хранения данных;
▶ трансляция Hive-запросов в MapReduce-задачи;
▶ сериализация и десериализация;
▶ тюнинг Join'ов в Hive;
▶ партиционирование, бакетирование, семплирование;
▶ User defined functions, Hive Streaming.

Продажник: bigdatateam.org/ru/big-data-course

Для просмотра скрытого содержимого необходимо Войти или Зарегистрироваться.

Автор темы	Похожие темы	Форум	Дата
A	[Udemy, Debayan Dey, Deys Academy] Бизнес-стратегии ИИ-агенты и агентский ИИ Полный практический курс по работе с ИИ-агентами C \| AIPC (2026)	Разное	16 Мар 2026
B	Практический курс по нейросетям [Тариф Creator Pro] [Syntx.AI] [Анастасия Романова, Максим Густарев]	Скоро	23 Янв 2026
B	Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]	Скоро	5 Май 2023
B	Практический курс по Big Data. Часть 2. Spark: from zero to hero [bigdata team]	Скоро	5 Май 2023
B	Практический курс по машинному обучению и Data Science [2022] [bigdata team] [А. Драль, Д. Игнатов, Н. Корепанова, К. Власов, П. Клеменков, А. Ашуха]	Скоро	24 Ноя 2021

Поиск

Поиск

Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive [bigdata team]

Bot

Администратор