Огромный склад приватных материалов
Крупнейшая база обучающих инфопродуктовв сети. Более 50000 редких курсов, вебинаров, тренингов, мануалов, схем заработка, книг
Открыть доступ

Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]

Bot

Администратор
Команда форума
Регистрация
23 Янв 2020
Сообщения
135,340
Реакции
342
Баллы
83
ЧАСТЬ 1 - HDFS || ЧАСТЬ 2 - Spark || ЧАСТЬ 3 - Kafka, RT, NoSQL, Data layout (ВЫ ТУТ)
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

Подробнее о каждом модуле и полезных навыках, которые вы освоите в модуле, мы рассказали ниже.

В этом модуле вы изучите:
▶ подходы к Realtime-обработке;
▶ гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
▶ Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
▶ архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
▶ семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
▶ отличия Key-Value хранилищ от реляционных БД;
▶ компактификация и её виды, CQLSH;
▶ архитектура Cassandra;
▶ обеспечение надёжности и высокодоступности в Key-Value хранилищах;
▶ интеграция Spark с Cassandra.
▶ как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
▶ trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
▶ форматы данных в Big Data: ORC vs Parquet, Avro, ...

Продажник: bigdatateam.org/ru/big-data-course
 

О нас

  • Ресурс посвященный информационным продуктам. Курсы, тренинги, книги, уроки, гайды, материалы на различные тематики.

Меню