
Обработка больших данных
Книга представляет собой информативное руководство, предназначенное для глубокого изучения технологий больших данных. В ней представлены как базовые понятия, так и продвинутые аспекты работы с данными в распределённых системах. Начинается всё с введения в основы, где подробно рассматриваются важность баз данных, их историческое развитие и экосистема Hadoop. Здесь также освещаются ключевые компоненты и инструменты, такие как HDFS, MapReduce, Hive, Pig, HBase, Sqoop и Flume, которые являются основой обработки и хранения данных.
Автор детально объясняет архитектуру Apache Hadoop и основные принципы его функционирования. Читатели смогут ознакомиться с примерами применения MapReduce и работой с данными в HDFS. Отдельное внимание уделяется Apache Spark, где рассматриваются его ключевые элементы, включая RDD (Resilient Distributed Dataset), DataFrames, Spark SQL, Spark Streaming, MLLib и GraphX. Книга не только описывает теоретические аспекты, но и предлагает практические рекомендации по установке и настройке этих технологий.
Часть, посвящённая Apache Kafka, охватывает основные принципы архитектуры, процессы проектирования и настройки кластеров, а также методы интеграции Kafka с другими системами. Эта информация будет полезна для специалистов, стремящихся создать гибкие и масштабируемые потоковые приложения.
Кроме того, в книге включены практические примеры и проекты, которые позволяют читателю применить на практике полученные знания. Эти задания помогут развить навыки анализа данных, создания потоковых приложений и интеграции технологий, таких как Hadoop, Spark и Kafka, в единое целое. Это пособие станет ценным ресурсом как для новичков, так и для более опытных специалистов в области больших данных, предлагая комплексный подход к освоению современных технологий.
Автор детально объясняет архитектуру Apache Hadoop и основные принципы его функционирования. Читатели смогут ознакомиться с примерами применения MapReduce и работой с данными в HDFS. Отдельное внимание уделяется Apache Spark, где рассматриваются его ключевые элементы, включая RDD (Resilient Distributed Dataset), DataFrames, Spark SQL, Spark Streaming, MLLib и GraphX. Книга не только описывает теоретические аспекты, но и предлагает практические рекомендации по установке и настройке этих технологий.
Часть, посвящённая Apache Kafka, охватывает основные принципы архитектуры, процессы проектирования и настройки кластеров, а также методы интеграции Kafka с другими системами. Эта информация будет полезна для специалистов, стремящихся создать гибкие и масштабируемые потоковые приложения.
Кроме того, в книге включены практические примеры и проекты, которые позволяют читателю применить на практике полученные знания. Эти задания помогут развить навыки анализа данных, создания потоковых приложений и интеграции технологий, таких как Hadoop, Spark и Kafka, в единое целое. Это пособие станет ценным ресурсом как для новичков, так и для более опытных специалистов в области больших данных, предлагая комплексный подход к освоению современных технологий.
Читать бесплатно онлайн Обработка больших данных - Джейд Картер
Вам может понравиться:
- Библиотеки Python Часть 2. Практическое применение - Джейд Картер
- Сверточные нейросети - Джейд Картер
- 120 практических задач - Джейд Картер
- IOT Интернет вещей - Джейд Картер
- Искусственный интеллект в прикладных науках. Транспорт и логистика - Джейд Картер
- Создай свой VPN. Безопасное использование интернета - Джейд Картер
- Искусственный интеллект в прикладных науках. Медицина - Джейд Картер
- Искусственный интеллект. Машинное обучение - Джейд Картер
- Самоучитель по блоку «Психолого-педагогическая диагностика личности педагогических работников» - Н. Гордиенко
- Сборник рецептов - Геннадий Федоров
- Нумерология. Самоучитель - Александр Колесников
- Литературный мастер: Секреты успешного преподавания литературы - Инна Баринова
- Открой мир слов: Инновационные подходы в обучении литературе - Инна Баринова
- «Шеф на Вашей кухне». Салаты и закуски - Виктория Роман
- Инцидент в Южно-Сибирске - Елена Лобанова
- Стихи-28. Рождённый в СССР - Василий Рем
- Как я приручила Марс - Лиза Дасна
- Русь извечная: Непокорённый город. Непокорённый город - Иван Караванов