Объединим ваши данные в единую модель, исключим ошибки, обеспечим достоверность информации
Построение хранилищ данных
Поможем научиться редактировать готовые шаблоны и стили, внедрить регламенты и сделать создание визуализаций частью бизнес-процессов
Визуализация данных
Поможем оптимизировать затраты на лицензию и сохранить необходимый функционал платформы
Лицензирование ПО
Определим задачи вашего бизнеса, составим критерии отбора, подберём лучшее решение. Сократим затраты на тестирование и снизим ваши риски
Помощь в выборе BI-платформы
Интегрируем BI-платформу, если её не было, или поможем перейти на новую
Внедрение BI-систем
Помощь в выборе BI-платформы
Определим задачи вашего бизнеса, составим критерии отбора, подберём лучшее решение. Сократим затраты на тестирование и снизим ваши риски
Определим потенциал генеративной аналитики для вашего бизнеса, разработаем критерии оценки решений, выберем оптимальную платформу и LLM модель. Сократим время на тестирование и минимизируем риски внедрения
Выбор, пилотирование и внедрение GenBI решений
Выбор, пилотирование и внедрение GenBI решений
Определим потенциал генеративной аналитики для вашего бизнеса, разработаем критерии оценки решений, выберем оптимальную платформу и LLM модель. Сократим время на тестирование и минимизируем риски внедрения
Внедрение BI-систем
Интегрируем BI-платформу, если её не было, или поможем перейти на новую
Все услуги
Поможем оптимизировать затраты на лицензию и сохранить необходимый функционал платформы
Лицензирование ПО
Поможем научиться редактировать готовые шаблоны и стили, внедрить регламенты и сделать создание визуализаций частью бизнес-процессов
Визуализация данных
Построение хранилищ данных
Объединим ваши данные в единую модель, исключим ошибки, обеспечим достоверность информации
Научитесь применять инструменты BI, собирать отчёты и дашборды, анализировать результаты, принимать эффективные решения и оптимизировать процессы
Корпоративное обучение
Корпоративное обучение
Научитесь применять инструменты BI, собирать отчёты и дашборды, анализировать результаты, принимать эффективные решения и оптимизировать процессы
Одна из самых первых отечественных BI-платформ. На рынке более 10 лет. Внешне напоминает PowerBI
Visiology
Self-service решение для работы с данными
Дельта BI
Платформа для создания отчётов и дашбордов от компании FanRuan
FineReport
Easy Report
Платформа, которая генерирует отчёты в мессенджерах. Встроены базовые функции BI
Одна из лучших BI-платформ, представленных на отечественном рынке, от FanRuan. Внешне похожа на Tableau
FineBI
Платформа BI-аналитики от БАРС Груп. Ориентирована на бизнес-пользователей
Analytic Workspace
Российская облачная и on-premise BI-платформа от Яндекс
DataLens
Apache Superset
Платформа с открытым кодом. Инструмент с высокой степенью кастомизации
Российская self-service платформа с неограниченным масштабированием
rapeed OLAP
Российская платформа с лучшими пользовательскими характеристиками в сегменте self-service от компании ДатаМайнд
Sigla Vision
Зрелый отечественный BI от Pix Robotics. Интерфейс напоминает Qlik Sense
Pix BI
BI-платформа, которая идеально интегрируется с системой 1С
Modus BI
Alpha BI
Конструктор аналитических решений. Российская альтернатива SAP BI, Oracle BI, IBM Cognos
Платформа с технологиями ETL и ELT для подготовки, очистки и трансформации данных от компании FanRuan
FineDataLink
Sigla Vision
Российская платформа с лучшими пользовательскими характеристиками в сегменте self-service от компании ДатаМайнд
Pix BI
Зрелый отечественный BI от Pix Robotics. Интерфейс напоминает Qlik Sense
Modus BI
BI-платформа, которая идеально интегрируется с системой 1С
Платформа с технологиями ETL и ELT для подготовки, очистки и трансформации данных от компании FanRuan
Все платформы
FineDataLink
Конструктор аналитических решений. Российская альтернатива SAP BI, Oracle BI, IBM Cognos
Alpha BI
Apache Superset
Платформа с открытым кодом. Инструмент с высокой степенью кастомизации
rapeed OLAP
Российская self-service платформа с неограниченным масштабированием
Омниканальная масштабируемая платформа визуализации данных. Разработка Сбера
Навигатор BI
Навигатор BI
Омниканальная масштабируемая платформа визуализации данных. Разработка Сбера
Российская облачная и on-premise BI-платформа от Яндекс
DataLens
Платформа BI-аналитики от БАРС Груп. Ориентирована на бизнес-пользователей
Analytic Workspace
Одна из лучших BI-платформ, представленных на отечественном рынке, от FanRuan. Внешне похожа на Tableau
FineBI
Visiology
Одна из самых первых отечественных BI-платформ. На рынке более 10 лет. Внешне напоминает PowerBI
Дельта BI
Self-service решение для работы с данными
FineReport
Платформа для создания отчётов и дашбордов от компании FanRuan
Платформа, которая генерирует отчёты в мессенджерах. Встроены базовые функции BI
Easy Report
Изучите основные функции, self-service наборы данных, ETL-инструменты, научитесь применять их в работе
FineBI. Быстрый старт
Закрепите знания и станьте сертифицированным экспертом от вендора
Интерактивные функции в FineBI
Научитесь создавать понятные визуализации и усилите свои навыки
Основы визуализации данных
Научитесь визуализировать данные и узнаете главные возможности платформы. Самостоятельное изучение
FineBI. Бесплатный курс
Научитесь настраивать и масштабировать платформу, управлять доступом и ресурсами
FineBI. Администрирование
Узнаете главные изменения, научитесь переносить данные и работать с последней версией платформы
Фишки FineBI v6
DEF-функции в FineBI
Научитесь проводить сложные сценарии вычислений и использовать все преимущества DEF-функций в аналитике данных
Изучите принципы работы, узнаете о полезных практиках от экспертов рынка
Бесплатный образовательный ретрит с FineBI
Углубите свои знания, научитесь управлять данными, использовать табличные вычисления
FineBI. Продвинутый курс
Закрепите знания и станьте сертифицированным экспертом от вендора
Сертификация FineBI
Разработчик отчётов FineReport
Сможете самостоятельно подключаться к источникам данных, разрабатывать отчёты и кросс-таблицы, создавать уникальные темы
Бесплатный образовательный ретрит с FineBI
Изучите принципы работы, узнаете о полезных практиках от экспертов рынка
FineBI. Продвинутый курс
Углубите свои знания, научитесь управлять данными, использовать табличные вычисления
Сертификация FineBI
Закрепите знания и станьте сертифицированным экспертом от вендора
Все программы
Сможете самостоятельно подключаться к источникам данных, разрабатывать отчёты и кросс-таблицы, создавать уникальные темы
Разработчик отчётов FineReport
DEF-функции в FineBI
Научитесь проводить сложные сценарии вычислений и использовать все преимущества DEF-функций в аналитике данных
Узнаете главные изменения, научитесь переносить данные и работать с последней версией платформы
Фишки FineBI v6
Научитесь настраивать и масштабировать платформу, управлять доступом и ресурсами
FineBI. Администрирование
Научитесь визуализировать данные и узнаете главные возможности платформы. Самостоятельное изучение
FineBI. Бесплатный курс
FineBI. Быстрый старт
Изучите основные функции, self-service наборы данных, ETL-инструменты, научитесь применять их в работе
Интерактивные функции в FineBI
Закрепите знания и станьте сертифицированным экспертом от вендора
Основы визуализации данных
Научитесь создавать понятные визуализации и усилите свои навыки
Бесплатный PDF-гайд от экспертов GlowByte с разбором типичных ошибок бюджетирования BI-проектов и рекомендациями по снижению затрат
Ошибки бюджетирования BI
Бесплатная таблица с сравнением BI-платформ по 88 критериям. Учли технические параметры, бизнес-задачи, формат развёртывания, уровень пользователей и зрелость вендора
Как выбрать BI платформу
Как выбрать BI платформу
Бесплатная таблица с сравнением BI-платформ по 88 критериям. Учли технические параметры, бизнес-задачи, формат развёртывания, уровень пользователей и зрелость вендора
Бесплатный PDF-гайд от экспертов GlowByte с разбором типичных ошибок бюджетирования BI-проектов и рекомендациями по снижению затрат
Ошибки бюджетирования BI
Нажмите «принять», если вы соглашаетесь с условиями обработки cookies и данных о поведении на сайте, нужных нам для аналитики. Запретить обработку cookies можно через браузер
Принять

FineBI: Обработка данных для начинающих пользователей

Приветствую всех, на связи команда Business Intelligence GlowByte.
Да-да, те самые неугомонные, которые создали самое крупное русскоязычное сообщество FineBI, проводят обучения, собирают дайджесты и ежегодно организуют масштабные конференции.
Меня зовут Александр, я руководитель центра поддержки и обучения BI-решений в GlowByte, и сегодня хочу поделиться с вами небольшим гайдом по обработке данных в FineBI. Этот материал будет полезен начинающим BI-разработчикам.

Данная статья состоит из четырех уроков, которые помогут вам ближе познакомиться с функциями редактирования данных в FineBI. Если после прочтения вы захотите разобраться со всеми особенностями платформы, закрепить базовые знания и прокачать навыки создания сложных визуализаций, приглашаю на наши курсы.
Урок 1: Обработка и упрощение структуры данных
1.1. Обработка структуры данных

Прежде чем приступить к анализу данных, часто необходимо провести определенные преобразования в структуре данных. Эти преобразования включают в себя изменение порядка строк и столбцов с целью обработки данных и формирования нужных полей для последующего анализа.

В FineBI для этого есть удобные инструменты, доступные в интерфейсе редактора данных, которые помогут достичь быстрого результата.
Функции обработки данных
Рассмотрим детальнее на примере функций «Split Rows and Columns» и «Convert Rows and Columns» и данных, которые содержат результаты экзаменов китайских студентов. Для этого запустим FineBI и создадим новый «Analysis Subject».

Первоначальная структура данных:
Как можно видеть, это сырые данные, которые пока невозможно анализировать
Используя функции «Split Field» и «Row to column», разделим колонку «Результаты экзамена» на колонки с оценками по соответствующим экзаменам.

Шаг 1: Разбиваем столбец «Результаты» по словам:
Результат 1 шага обработки
Шаг 2: Разбиваем получившийся после split столбец по 2 символа:
Результат 2 шага обработки
Данные после обработки:
Итоговый результат: после разделения данных на разные столбцы и ряды структура стала понятнее и проще
1.2 Удаление дублей

При анализе данных вопрос качества всегда является наиболее острым, а повторяющиеся строки — самой распространенной проблемой. При удалении этих строк мы можем столкнуться с двумя сценариями развития логики вычислений.

В первом случае абсолютно неважно, какую из строк мы сохраним, поскольку это никак не повлияет на анализ. К примеру, в ряду «А, А, А» мы можем оставить любую А. В этом случае для оптимизации процесса можно использовать функцию «Delete Duplicate Row» (удалить повторяющиеся строки).

Во втором случае необходимо оставить конкретную строку. Например, в ситуации, когда студенты пересдавали экзамен и на каждого студента будет два набора данных, а при анализе нам нужно будет оставить тот, где содержатся последние записи. В ситуации, когда из «А, В, С» нужно оставить именно А, мы должны применить функцию «Delete Duplicate Row» так, чтобы сохранить первую строку. Для этого сначала отсортируем данные функцией «Sort», а затем удалим строки функцией «Delete Duplicate Row».
Выберите поле «убрать повтор», чтобы быстро удалить дубли
Для проверки дублей в данных вы также мы можете использовать функционал фильтрации в заголовках.
Выпадающее меню заголовка анализирует имеющиеся поля и быстро обнаруживает дубли
1.3. Работа со значением null

Одним из наиболее проблемных моментов при анализе данные является наличие в таблице значений null.

Когда у нас большие объемы данных и «null» встречается редко, это может не сильно повлиять на наши вычисления суммы или среднего значения. В таких случаях мы можем просто проигнорировать эти значения.

Но если в процессе обработки данных некоторые значения «null» следует исключить как нежелательные данные целиком, мы можем использовать удобный фильтр в заголовке таблицы для быстрого исключения пустых значений.
Фильтрация по заголовкам быстро обнаружила пустое поле и далее предлагает выбрать, нужно ли его фильтровать или нет
Выше показан простой сценарий обработки, но в реальной жизни, возможно, вам придется столкнуться с ситуациями, когда значение «null» важно для сохранения логики вычислений.

Рассмотрим эту ситуацию на примере нашего датасета с данными по успеваемости студентов. Вероятно, один из учеников пропустил занятие по болезни, поэтому в системе отсутствует запись о его оценке по одному из экзаменов — мы не можем не учитывать его, поэтому не можем просто удалить его данные из базы.

Нам стоит очень внимательно относиться к подобным ситуациям, чтобы при дальнейших расчетах выборочно выставлять фильтры. Для этого в FineBI можно использовать функцию «Formula Column» (добавить столбец с вычисляемым значением по формуле) или же более удобную: «Condition Tag Column» (добавить столбец со значением по условию).
Отмечаем студентов без оценок как пропустивших экзамен
Урок 2: Объединение и анализ множества таблиц
Аналитики часто сталкиваются с ситуацией, когда данные представлены в нескольких таблицах. Прежде чем начать анализ, возникает вопрос: как объединить эти таблицы? Для тех, кто только начинает изучать бизнес-аналитику, давайте рассмотрим два примера использования функции объединения: «Union All» и «Join».

Давайте представим, что у нас есть несколько одинаковых таблиц, содержащих результаты экзаменов в разных учебных группах. Если мы хотим объединить эти таблицы с сохранением всех данных, мы используем операцию «Union All». Это как если бы мы просто склеивали эти две таблицы вертикально, добавляя строки из второй таблицы после строк первой таблицы.
В таблице стало больше строк, но количество колонок осталось прежним
Теперь давайте представим, что в одной из таблиц стало больше колонок, например добавилась колонка с общей оценкой успеваемости. Перед тем, как мы подробно рассмотрим функцию «Join», изучим еще одну похожую функцию «Column from Other Tables» (добавить колонку из другой таблицы).

Вам наверняка уже знакомы «Vlookup» и «Sumif» из Excel. Как вы уже могли догадаться, эта функция позволяет агрегировать (Sumif) или искать соответствующие измерения из других таблиц и объединять их с текущей таблицей (Vlookup).
После того, как мы суммировали баллы по заданным параметрам, у нас появилось новая колонка
Любителям SQL функции left join и right join знакомы, пожалуй, очень даже хорошо, поэтому, используя функцию «объединить слева и справа» при редактировании данных в BI, можете смело руководствоваться логикой SQL.

Для тех, кто привык работать с SQL и знаком с операторами типа left join, right join и т. д., функция «Join» в редакторе данных FineBI может быть более интуитивно понятной. Эта функция ведет себя аналогично SQL-операторам и может быть легко освоена теми, кто уже знаком с базовыми принципами SQL.
Урок 3: Создание вычислений и аналитических показателей
Когда вы подготовили структуру данных и объединили несколько таблиц, важно остановиться и подумать о проблеме которую мы исследуем. Проверьте, есть ли в ваших таблицах необходимые показатели для решения задачи, или нужно добавить новые вычисления или аналитические показатели.

Например, при анализе продаж часто приходится самостоятельно вычислять прибыль, темпы роста и прочие показатели. Поэтому перед проведением анализа мы можем вставить расчетные формулы непосредственно в таблицу с данными. В FineBI это можно сделать с помощью уже знакомой вам функции «Formula Column». Она работает так же, как формула в Excel, необходимо лишь ввести соответствующую формулу, чтобы создать нужное поле.
Интерфейс редактора формул
Затем с помощью функции «Summary Column» мы можем легко рассчитать сумму.
Выберите соответствующую группу и метод расчета, чтобы провести вычисления для указанных показателей
Функция «Condition Tag Column» помогает решать самые проблемные для аналитиков вопросы, связанные с условием IF. Так, нам не нужно прописывать 7−8 уровней условия IF — от нас требуется лишь настроить некоторые условия вручную, чтобы присвоить данным разные значения.
Добавив условие, мы можем отфильтровать данные и присвоить им соответствующие значения
Урок 4: Верификация обработанных данных
Для начинающих BI-разработчиков основные сложности заключаются не только в понимании вычислительной логики большого количества функций BI-решения, но и в верификации обработанных данных. Наверняка у вас часто возникают подобные мысли: «Я сделал все как нужно, но правильно ли получилось?»

Для решения данной задачи FineBI предоставляет большое количество полезных функций.

4.1. Верификация по заголовку

Для быстрой проверки суммы и среднего значения достаточно выбрать необходимую колонку и обратить внимание на информацию в левом нижнем углу. Таким образом можно проверить полученные данные и определить их достоверность.
При проверке данных мы получили среднее значение равное 85.92, что соответствует нашим данным
4.2. Добавление и удаление шагов обработки данных

FineBI позволяет беспрепятственно добавлять или удалять некоторые шаги обработки данных. Благодаря этой возможности мы можем отфильтровать важные данные, а затем удалить некоторые шаги обработки, которые вызывают сомнения. Тем самым мы можем методом проб и ошибок посмотреть, как будут изменяться данные. Это похоже на то, как когда-то в школе мы много раз проверяли, верно ли решено уравнение.
Отфильтруем часть данных по заголовку, чтобы провести «выборочную проверку»
Воспользуемся подсказками в области действий, чтобы быстро проверить данные
Наш вводный урок по редактированию данных подошел к концу.
Датасет для тренировки можно скачать по ссылке.
Свои вопросы можете смело задавать в самом крупном сообществе FineBI в России.

По всем вопросам о продукте, ценах на лицензии, миграции пишите: bi@glowbyteconsulting.com
2 раза в месяц получайте на почту полезную подборку с новостями из мира бизнес-аналитики, практическими материалами и мероприятиями
Подпишитесь на дайджест

Актуальные новости и полезные материалы

    Телеграм
    Для звонков по России
    Почта
    Решим любой вопрос по работе с BI-системами
    Свяжитесь с нами удобным для вас способом или оставьте заявку на консультацию — мы перезвоним