
Обработка больших данных
Книга представляет собой информативное руководство, предназначенное для глубокого изучения технологий больших данных. В ней представлены как базовые понятия, так и продвинутые аспекты работы с данными в распределённых системах. Начинается всё с введения в основы, где подробно рассматриваются важность баз данных, их историческое развитие и экосистема Hadoop. Здесь также освещаются ключевые компоненты и инструменты, такие как HDFS, MapReduce, Hive, Pig, HBase, Sqoop и Flume, которые являются основой обработки и хранения данных.
Автор детально объясняет архитектуру Apache Hadoop и основные принципы его функционирования. Читатели смогут ознакомиться с примерами применения MapReduce и работой с данными в HDFS. Отдельное внимание уделяется Apache Spark, где рассматриваются его ключевые элементы, включая RDD (Resilient Distributed Dataset), DataFrames, Spark SQL, Spark Streaming, MLLib и GraphX. Книга не только описывает теоретические аспекты, но и предлагает практические рекомендации по установке и настройке этих технологий.
Часть, посвящённая Apache Kafka, охватывает основные принципы архитектуры, процессы проектирования и настройки кластеров, а также методы интеграции Kafka с другими системами. Эта информация будет полезна для специалистов, стремящихся создать гибкие и масштабируемые потоковые приложения.
Кроме того, в книге включены практические примеры и проекты, которые позволяют читателю применить на практике полученные знания. Эти задания помогут развить навыки анализа данных, создания потоковых приложений и интеграции технологий, таких как Hadoop, Spark и Kafka, в единое целое. Это пособие станет ценным ресурсом как для новичков, так и для более опытных специалистов в области больших данных, предлагая комплексный подход к освоению современных технологий.
Автор детально объясняет архитектуру Apache Hadoop и основные принципы его функционирования. Читатели смогут ознакомиться с примерами применения MapReduce и работой с данными в HDFS. Отдельное внимание уделяется Apache Spark, где рассматриваются его ключевые элементы, включая RDD (Resilient Distributed Dataset), DataFrames, Spark SQL, Spark Streaming, MLLib и GraphX. Книга не только описывает теоретические аспекты, но и предлагает практические рекомендации по установке и настройке этих технологий.
Часть, посвящённая Apache Kafka, охватывает основные принципы архитектуры, процессы проектирования и настройки кластеров, а также методы интеграции Kafka с другими системами. Эта информация будет полезна для специалистов, стремящихся создать гибкие и масштабируемые потоковые приложения.
Кроме того, в книге включены практические примеры и проекты, которые позволяют читателю применить на практике полученные знания. Эти задания помогут развить навыки анализа данных, создания потоковых приложений и интеграции технологий, таких как Hadoop, Spark и Kafka, в единое целое. Это пособие станет ценным ресурсом как для новичков, так и для более опытных специалистов в области больших данных, предлагая комплексный подход к освоению современных технологий.
Читать бесплатно онлайн Обработка больших данных - Джейд Картер
Вам может понравиться:
- Сверточные нейросети - Джейд Картер
- Библиотеки Python Часть 2. Практическое применение - Джейд Картер
- IOT Интернет вещей - Джейд Картер
- 120 практических задач - Джейд Картер
- Создай свой VPN. Безопасное использование интернета - Джейд Картер
- Искусственный интеллект в прикладных науках. Транспорт и логистика - Джейд Картер
- Искусственный интеллект в прикладных науках. Медицина - Джейд Картер
- Искусственный интеллект. Машинное обучение - Джейд Картер
- Астрология. Книга начинающего астролога - Анастасия Инсалита
- Краткий обзор английской грамматики - Александр Пахотин
- Польский язык – это круто! Тетрадь упражнений для изучающих польский язык - Urszula Arczewska
- Англійська мова. Теорія і практика. Страждальний стан - Ричард Грант
- Англійська мова. Теорія і практика. Дієприкметник - Ричард Грант
- Время собирать деньги, или Краткое руководство к финансовой свободе - Калеб Гранд
- Инцидент в Южно-Сибирске - Елена Лобанова
- Стихи-28. Рождённый в СССР - Василий Рем
- Попасть в космический десант - Анна Кали
- Странная сказка про жизнь - Дина Бисопа