Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие - Валентин Арьков

Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие

Страниц

30

Год

Современные системы бизнес-аналитики активно используют мощные инструменты ETL (Extract-Transform-Load) для работы с различными источниками данных. Очень важно понимать, что ETL означает «извлечение, преобразование и загрузка данных», и представляет собой фундаментальный процесс, неотъемлемый для работы системы бизнес-аналитики. Основная цель ETL - загрузить данные в высокопроизводительное хранилище данных, чтобы их можно было обработать и проанализировать системой бизнес-аналитики.

Процесс ETL начинается с извлечения данных из различных источников, таких как базы данных, файлы, веб-сервисы и другие. После этого данные проходят этап преобразования, где производится структурирование, очистка и преобразование данных в соответствии с потребностями аналитической системы. Наконец, преобразованные данные загружаются в электронные таблицы, которые служат основой для дальнейшего анализа и обработки.

Примером простейшего сценария ETL является загрузка данных в виде одной объединенной и консолидированной таблицы. Это облегчает работу с данными, упрощает их анализ и позволяет сделать более точные выводы о бизнес-процессах и трендах. Электронные таблицы обеспечивают удобную и гибкую среду для работы с данными, позволяя пользователям создавать отчеты, графики и диаграммы для визуализации результатов анализа.

В данной статье мы рассмотрим основные этапы процесса ETL на примере загрузки данных в электронные таблицы. Вы узнаете о различных методах извлечения данных, а также о методах и инструментах для их преобразования и загрузки. Также мы рассмотрим примеры использования электронных таблиц для анализа данных и создания информативных отчетов.
Как видно из текста, ETL - важная составляющая современных систем бизнес-аналитики, и его правильное применение позволяет получить полезную и актуальную информацию для принятия решений. До использования систем ETL аналитики обрабатывали данные вручную, что затрудняло процесс и требовало значительных затрат времени и ресурсов. Но благодаря ETL обработка данных стала автоматизированной, что позволило сократить время и снизить вероятность ошибок при анализе. Кроме того, системы ETL позволяют легко интегрировать данные из различных источников и обеспечивают гибкость и масштабируемость для систем бизнес-аналитики. Появление электронных таблиц значительно облегчило работу с данными, позволяя пользователям быстро и удобно обрабатывать информацию, создавая отчеты и диаграммы. Все это сделало системы бизнес-аналитики значительно эффективнее и доступнее для предпринимателей и руководителей различных предприятий.

Читать бесплатно онлайн Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие - Валентин Арьков

© Валентин Юльевич Арьков, 2020


ISBN 978-5-4498-4086-8

Создано в интеллектуальной издательской системе Ridero

Введение

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики [1—5]. В простейшем случае это загрузка данных в виде одной, объединённой таблицы Excel.

Задание. Прочитайте в Википедии статью «ETL» и выясните, какие действия над данными производят на каждом из трёх этапов.


Отчёт оформляем в виде рабочей книги Excel – как и в предыдущих работах. Процедура оформления отчёта подробно описана в работе [6].

Не забывайте записывать в отчёт ответы на задания типа «выясните…». Когда вы что-то узнали, зафиксируйте это в своём произведении. Упражнения на изучение – это часть данной лабораторной работы.

При использовании данных из внешних источников нужно указывать, откуда были получены данные, каким образом и когда.

Задание. Создайте файл отчёта. Оформите титульный лист и оглавление. Сохраните файл под коротким информативным названием.


В качестве исходных данных мы будем использовать сведения об акциях. Это так называемые ЦЕННЫЕ БУМАГИ. Акцию конкретной компании иногда называют просто «бумага». Акции приобретают с разными целями. Торговля акциями, в основном, происходит на бирже.

Задание. Прочитайте в Википедии статью «Акция (финансы)» и выясните, какие права она даёт владельцу, а также какие два вида акций существуют.


В оформлении обложки использованы изображения, разработанные компанией OnlineWebFonts.

1. Инструменты ETL в Microsoft Excel

В пакете Microsoft Excel версий 2010 и 2013 функции ETL реализованы с помощью надстройки Power Query.

Power Query позволяет решать следующие задачи:

– извлечение – импорт данных из различных источников;

– преобразование – приведение данных к единому формату;

– загрузка – консолидация / объединение данных из нескольких источников в виде одной таблицы Excel.

Название Power Query можно расшифровать как «Средство из комплекта PowerBI для выполнения запросов к источникам данных». В свою очередь, PowerBI – это программный комплекс (или платформа) бизнес-аналитики (BI – Business Intelligence), включающий целый ряд отдельных компонентов.

Задание. Прочитайте в Википедии статью «Power BI» и выясните, какие компоненты входят в настольную (локальную) версию Power BI Desktop и какова стоимость этой версии.


Платформа Power BI доступна в разных вариантах. Есть версии программы, которые можно скачать и установить бесплатно. Естественно, с рядом ограничений. Но это уже позволяет познакомиться с ключевыми возможностями продукта.

Задание. Перейдите на следующий сайт:

https://powerbi.microsoft.com.

Выясните, какие версии PowerBI доступны для скачивания.


Для установки Power Query потребуется сказать эту надстройку. Заходим на страницу Центра загрузки Microsoft:

https://download.microsoft.com

Вызываем поиск:

Power Query Excel.

Получаем ссылки для скачивания (рис. 1.1).


Рис. 1.1. Power Query в Центре загрузки


Задание. Найдите страницу Power Query в Центре загрузки и выясните год выпуска этой надстройки и поддерживаемые версии Excel.

Вам может понравиться: