Что такое BI-системы и зачем они нужны?
Поговорим о людях, склонных вечно детализировать, упорно искать и находить новые выгодные перспективы, выдвигать гипотезы и приумножать капитал. Речь об аналитиках Business Intelligence и используемых ими инструментах. Обсудить Business Intelligence (BI) – технологии сбора, анализа и визуализации данных, которые выявляют новые стратегические возможности для бизнеса. BI-аналитик оперирует двумя источниками информации: получаемыми с рынка внешними данными и внутренними данными компании, в которой он работает. Порции информации из внутренних и внешних источников поступают регулярно, то есть они находятся в постоянном движении на своеобразных линиях ускользания от BI-аналитика. По аналогии с диджеем, сводящим дорожки, BI-аналитик выстраивает ускользающие линии информации и затем фиксирует их таким образом, чтобы создать картину, конфигурацию, пригодную для интерпретации, бизнес-анализа и принятия решений. В итоге цель BI-аналитика – открыть выгодные для бизнеса перспективы. В обязанности BI-аналитика входит: Бизнес-процессы описываются тысячами показателей. Например, для анализа продаж детской игрушки понадобятся сведения о географическом положении магазина, с какими товарами и в какой день недели покупалась игрушка, на какой полке располагалась игрушка, как производилась оплата – по кредитной, дебетовой карте или наличными – и так далее. Детализация приводит к образованию больших массивов данных, которые нужно правильно структурировать для дальнейшего анализа. Обычно данные хранятся в базах данных, поэтому BI-аналитик должен уметь писать SQL-запросы на разных диалектах. Для создания сложных многотабличных запросов и быстрого получения результата – по сравнению с простой двумерной таблицей – применяют OLAP (англ. online analytical processing, интерактивная аналитическая обработка), в котором массив данных структурируется в виде многомерной таблицы, OLAP-куба (рис. 1). Оси такого куба – анализируемые показатели, а на пересечении осей – данные. Рис. 1. Иллюстрация OLAP-куба Хорошо, если в таблицах нет пропущенных значений, дубликатов, аномалий и сам массив данных самодостаточен – по нему можно решить задачу анализа без обогащения массива данными из внутренних или внешних источников. Так бывает не всегда. Поэтому для подготовки данных к анализу BI-аналитики применяют шаг Transform (очистка данных) из метода предобработки ETL (англ. Extract, Transform, Load – «извлечение, преобразование, загрузка»): Из языков программирования приоритет отдается Python и R. Язык R изначально разработан для анализа и статистической обработки данных. В Python для работы с данными используют библиотеку pandas, а для визуализации множество других библиотек: matplotlib, plotly, seaborn, bokeh, altair, ipyleaflet, folium. Подробнее о работе с Pandas и визуализации данных читайте в наших статьях: Отображение результатов в визуальном формате – графики, диаграммы или на карте – дает представление о наиболее важных показателях, которые не всплывают в контексте таблицы. Информации много, поэтому вручную писать код для каждого графика занимает много времени. Чтобы клепать отчеты в промышленных масштабах BI-аналитик пользуется платформами с функциями хранилища данных, автоматизированной отчетности и построения дашбордов. Что такое дашборд Дашборд – приборная панель с интерактивными графиками и диаграммами (рис. 2). Рис. 2. Приборная панель Microsoft Power BI Один из главных инструментов аналитика – специальные BI-платформы. На некоторых платформах удобнее рисовать графики, на других сводить данные, а у третьих крутая кривая обучения, чтобы полностью использовать их возможности. Учитывая, что платформы в 9/10 случаев платные, нужно определиться, какой функционал нужен. В вакансиях на Хедхантере чаще всего фигурируют Tableau и Power BI. powerbi.microsoft.com | Цена: Power Desktop распространяется бесплатно, Pro-версия стоит от 625 ₽/мес. Power BI Desktop – часть набора продуктов Power BI. Desktop-версия устанавливается на локальный компьютер и позволяет подключать, преобразовывать и визуализировать данные. Power BI Pro – продвинутая версия с большим функционалом. Функциональность Pro-версии: Рис. 3. Дашборд Microsoft Power BI tableau.com | Цена: от 70 $/мес. C 2003 г. Tableau помогает не техническим специалистам создавать визуальную аналитику и интерактивные графики. Система имеет интуитивный и не загроможденный пользовательский интерфейс. Функциональность: Рис. 4. Дашборд Tableau qlik.com | Цена: 30 $/мес. Qlik – дает доступ к облачной аналитике с низким порогом вхождения и прозрачной ценовой политикой в отличие от Tableau (pdf, англ., шестая страница). Функциональность: Рис. 5. Дашборд Qlik oracle.com/business-analytics | Цена: от 16 $/мес. Oracle Analytics Cloud предлагает комплексную бизнес-аналитику, формирование отчетности, машинное обучение из коробки и возможности визуализации данных. Функциональность: Рис. 6. Дашборд Oracle Analytics Cloud metabase.com | Цена: бесплатно на своем хостинге или от 85 $/мес. за облако. Metabase – инструмент бизнес-аналитики с открытым исходным кодом. Он не требует знания SQL и имеет приятный интерфейс, позволяющий создавать аналитические графики всего несколькими щелчками мыши. Функциональность: Рис. 7. Дашборд Metabase Зарплата: от 60 тыс. руб. (актуально на момент публикации статьи в г. Москва). Требования: Если вас вдохновляет Big Data, срезание, сведение и перемещение блоков информации, механизмы селекции бизнес-процессов или просто капитализм, то, возможно, профессия BI-аналитика – ваше призвание. *** Образовательная онлайн-платформа GeekBrains проводит набор на курс BI-разработчик. Новички освоят востребованную специальность за 12 месяцев обучения под руководством ведущих экспертов крупных российских компаний. Действующие аналитики и маркетологи повысят профессиональный уровень и смогут увеличить свои доходы. Основная программа: Дополнительные бесплатные курсы: Итог обучения: Интересно, хочу попробоватьЧем занимается BI-аналитик?
Инструменты BI-аналитика
SQL-запросы
Технология OLAP
Метод ETL
Языки Python и R
Популярные BI-платформы
Microsoft Power BI
Tableau
Qlik
Oracle Analytics Cloud
Metabase
Литература
Интернет-ресурсы и YouTube-каналы
Резюме начинающего BI-аналитика
- 0 views
- 0 Comment