Содержание
Data Governance — что это и зачем нужен
Когда два отдела решают одну задачу, то могут выдать разные данные. Это не проблема софта, а отсутствие единообразия в работе с показателями, из-за чего бизнес теряет деньги. Исправить всё может подход Data Governance — в переводе «руководство или система управления данными». Рассказываем, как он преобразует информацию в актив компании.
-
Что такое Data Governance и причём тут библиотека
Data Governance (DG) — это установленный порядок работы с данными, которые появляются в процессе деятельности компании и применяются для принятия текущих решений, оценок эффективности, создания проектов, прогнозирования. Слово «governance» здесь означает «руководство» или «свод правил». Он позволяет получать точную и непротиворечивую информацию, правильно её использовать, избегать рисков от неверной интерпретации. Если считать конкретный бизнес библиотекой, то она включает:
- данные, которые получают из разных источников и хранят на разных полках, — книги;
- Data Governance — директора библиотеки, который решает, как описывать книги, кому выдавать, где хранить;
- Data Management (управление данными) — библиотекарей, которые ищут, систематизируют, выдают материалы пользователям;
- системы хранения данных — полки и каталоги.
-
DG включает:
- правила сбора, обработки, хранения общих данных;
- систему распределения ответственности за работу с ними;
- контроль выполнения стандартов управления данными;
- правила хранения, обработки, использования персональных и корпоративных сведений, которые нуждаются в особой защите и не должны быть общедоступными;
- показатели оценки эффективности работы с материалами.
-
Всё это позволяет сотрудникам компании использовать одни и те же термины, понимать друг друга. За каждую метрику отвечает конкретный отдел. Создание, изменение, использование корпоративных данных прозрачны для имеющих доступ. В массиве сразу обнаруживаются ошибки, что позволяет быстро их устранить и продолжать работу без задержек.
Применение Data Governance становится актуальнее потому, что, согласно исследованию СберАналитики, компании активно внедряют в работу искусственный интеллект (ИИ) и автоматизируют многие процессы. На начало 2026 года автоматизацию используют 38% представителей крупного бизнеса, 22% фирм из сферы малого бизнеса. Её применяют для упрощения документооборота и приёма заявок от клиентов (70%), бухгалтерии и финансового учёта (55%), стратегического планирования проектов (34%). Для всех направлений автоматизации бизнес-процессов особенно важны чёткие правила сбора, обработки, защиты, хранения информации, единообразие терминологии. Иначе она будет искажённой, то есть непригодной для аналитики и принятия решений. -
Data Governance vs Data Management: в чём разница
Data Governance и Data Management — это дополняющие друг друга инструменты управления компанией. Их роли распределяются следующим образом:
- DG представляет собой руководство по эксплуатации. Это стратегия и контроль работы с персональной и корпоративной информацией. Они дают ответы на вопросы о том, что с ней делать, кто отвечает за соблюдение стандартов.
- Data Management (DM) представляет собой этапы эксплуатации. Это тактика управления данными и исполнение необходимых процессов: сбора, обработки, хранения, защиты, использования. Она определяет, как компания должна работать с ними.
-
Например, Data Governance устанавливает, что у клиента может быть один ИНН и его номер обязателен для систем компании, а Data Management обеспечивает технические средства для выполнения этого требования.
-
Три кита Data Governance: люди, процессы и (чуть-чуть) технологии
Для успешного использования Data Governance недостаточно программы. Необходимы три составляющих:
- люди, которые участвуют в DG;
- регламентирующая документация;
- процессы и технологии.
-
Сотрудники компании, работающие с данными на основе Data Governance, выполняют следующие роли:
- Data Owner — владелец данных. Это руководитель, который несёт персональную ответственность за определённый пул материалов. Например, финансовый директор отвечает за раздел «Сведения по финансовым операциям», директор по маркетингу — за «Клиентские данные». Руководство принимает решения по управлению: какие критерии определяют качество, кому открыть доступ.
- Data Steward — стюард или распорядитель данных. Он следит за исполнением стратегии, разработанной владельцем. В его обязанности входит формализация правил, контроль их соблюдения, отслеживание ошибок и дублирующей информации, аналитика других проблем. Он может, например, составить инструкцию, обучить пользователей нюансам заполнения полей в системе учёта компании, довести до руководства необходимость корректировки стратегии, если при её реализации нашлись ошибки.
-
Регламентирующая документация, как часть DG, включает:
- Бизнес-глоссарий или словарь терминов. Это документ, который регламентирует, как в компании должны обозначаться показатели и процессы. Например, устанавливает, что клиент — это физическое лицо, купившее товар; выручка — сумма, полученная за проданные товары без налога на добавленную стоимость.
- Политику и стандарты. Первый документ определяет принципы работы с данными, например, с какой частотой будет проводиться аналитика, как выявляется качество. Стандарты делают политику более конкретной, то есть устанавливают важные технические детали. Например, какие поля нужно заполнить, в каком формате фиксируется дата продажи.
- Процессы и технологии. Это действия, необходимые для работы DG. Процесс управления качеством данных заключается в фиксации ошибок, их исправлении, профилактике возникновения. Процесс управления метаданными обеспечивает их сбор, хранение, поддержку актуальности. Процесс управления доступом регулирует, кто может запрашивать информацию, кто принимает решение о доступе, как часто он обновляется.
-
Инструменты Data Governance: как автоматизировать порядок
Есть несколько инструментов Data Governance:
- Бизнес-глоссарии и каталоги данных. Это централизованные системы, которые выполняют роли библиотек и словарей понятий для всех используемых компанией данных. Бизнес-глоссарий делает акцент на терминах, например, «Активный пользователь», «Складские остатки». Инструмент даёт им определения на понятном сотрудникам языке. Каталог данных (Data Catalog) сосредоточен на технической инвентаризации источников информации с возможностью поиска. С его помощью сотрудники ориентируются в таблицах, файлах, дашбордах. Оба инструмента нужны для упорядочения данных, удобного и быстрого поиска, устраняют разрозненность и смысловые расхождения. Они автоматизируют сканирование и индексацию каталогов для всех корпоративных систем, позволяют классифицировать сведения. Бизнес-пользователи легко находят нужный набор данных через обычный поиск, видят его создателя, дату формирования, возможность использования для отчётности. Аналитики получают актуальную схему материалов, документы и информацию о данных, нуждающихся в специальной защите.
- Инструменты Data Quality, то есть качества данных. Это программные решения для оценки, исправления, отслеживания их состояния на базе установленных правил. Материалы могут содержать дубликаты, пропуски, устаревшие числа или противоречия. Data Quality контролируют и фильтруют их, проверяют на соответствие стандартам. Инструменты качества данных выполняют обработку с тем, чтобы унифицировать их, сделать пригодными для аналитики. Сначала выявляются ошибки, аномалии, скрытые закономерности. Затем устраняются обнаруженные проблемы, например, исправляются опечатки, удаляются дублирующие сведения, восстанавливается единый формат. Data Quality проводят мониторинг в режиме реального времени, блокируют попадание в систему некачественных данных, отправляют ответственным сотрудникам сообщения об ошибках.
- Инструменты Data Lineage — жизненного цикла или происхождения данных. Это решения для визуализации и отслеживания пути информации от источника и создания до конечного потребления в виде отчёта, дашборда, таблицы. В компании сведения проходят через несколько этапов: попадают в хранилище, проходят обработку, преображаются в готовые структуры для документов и аналитики. Если в материалах есть ошибки, без Data Lineage пришлось бы долго их искать. Программное решение позволяет отслеживать изменения внутри системы, например, как сумма заказа преобразовалась в выручку. Также оно демонстрирует связи между показателем, представленным визуально, и его техническим происхождением плюс промежуточными изменениями. Например, руководитель компании может видеть не только цифру в отчёте, но и понять, откуда она взялась — из какой таблицы и исходной системы.
-
Как внедрить Data Governance
Внедрить DG в работу компании можно в три этапа:
- Аудит (инвентаризация). Нужно изучить текущее состояние данных в бизнесе. Выявляются их источники, владельцы, структура, форматы хранения. Нужно установить проблемы с качеством, дублированием информации, разрозненностью терминологии между подразделениями компании. Исследуются текущие процессы работы с материалами, роли сотрудников, которые их создают, изменяют и применяют. Результатом аудита становится документально оформленное описание сегодняшней структуры данных и список критических точек, с которыми нужно работать в первую очередь.
- Стратегия. На основе аудита создают модель управления данными, с учётом масштаба и специфики компании. Определяются политика и принципы, по которым будет работать система: подходы к назначению ответственности, стандарты качества. Разрабатываются правила классификации, обеспечения защиты персональной и корпоративной информации, процессы управления её изменениями. Устанавливаются измеримые цели внедрения Data Governance, например, сокращение времени поиска метрик или снижение количества ошибок в отчётности. Разрабатывается механизм внедрения с последовательностью шагов, сроками, распределением ресурсов. Стратегия диктует, какие обновления потребуются в организационной структуре, процессах и технологиях. Она определяет и процедуру контроля с созданием отчётности.
- Пилотный проект (MVP — Minimum Viable Product, перевод — минимально жизнеспособный продукт). Разработанную стратегию реализуют в ограниченном масштабе, например, в рамках отдела компании. Нужно выбрать сценарий использования, где проблемы заметнее, а эффект от DG можно измерить. Внедряются основные элементы системы: назначаются ответственные, настраиваются процессы контроля качества и ведения бизнес-глоссария. Это позволяет проверить работоспособность проекта в реальных условиях, найти скрытые проблемы и устранить недочёты до распространения Data Governance на всю компанию. Успех пилотного проекта создаёт пример эффективности и основу для дальнейшего расширения системы.
-
Системный подход к работе с данными позволил производителю ювелирных украшений «Sokolov» выбрать локации для новых магазинов, усовершенствовать стратегию открытия торговых точек и спрогнозировать выручку. Это стало возможным, благодаря вычислению с помощью инструментов СберАналитики главных показателей бренда. На базе расходов покупателей установили динамику среднего чека, оценили среднемесячный оборот, количество покупок. В результате была скорректирована маркетинговая стратегия и повысились продажи.
-
Частые ошибки при внедрении и как их обойти
По данным СберАналитики 82% российских компаний использует для работы с данными отечественные платформы, 70% довольны ими. Но это не избавляет от проблем, если совершать ошибки:
- Купить дорогой софт и думать, что Data Governance внедрён. Но инструменты сами не создают процессы, не назначают ответственных, не улучшают качество информации. Исправление ошибки: начать с политики, процессов и людей, а софт подбирать под задачи. Нужно определить, что требует управления данными, кто станет владельцами и распорядителями, как будет выполняться контроль и поддержка. После формулирования требований выбирается инструмент для автоматизации процессов. Это гарантия достижения конкретных целей.
- Передать всю ответственность отделу интернет-технологий (IT). ИТ-специалисты могут настроить техническую инфраструктуру, обеспечить хранение, обработку материалов, интеграцию, но не знают о значении показателей в контексте бизнеса. Так в массиве появляются неточности и передаются по всем этапам. Исправление ошибки: владельцами данных должны быть бизнес-руководители, иначе качество информации не повысится никогда. Ответственность за данные должна быть закреплена за сотрудниками, которые их создают и используют. Бизнес определяет, какие значения корректны, как интерпретировать показатели, какие правила нужно контролировать.
- Попытка охватить все процессы управления и создать регламент большого объёма. Это приводит не к упорядочиванию, а к обратному эффекту. Создание такого регламента требует времени, а к моменту его утверждения часть информации устаревает. Излишне детализированные документы сложно воспринимать и соблюдать. Сотрудники их игнорируют, а система управления остаётся на бумаге.
-
Исправление ошибки: итеративность, то есть простые правила, которым легко следовать. Лучше начать с небольшого числа данных и чётких требований, которые можно быстро внедрить. По мере накопления опыта и обратной связи правила уточняют, расширяют. Это позволяет системе управления развиваться параллельно с нуждами бизнеса, сохранять актуальность.
- Data Governance — это инвестиция в предсказуемость. Можно не тратить часы на сверку отчётов, доверять данным для принятия решений, масштабировать бизнес без риска утонуть в информационном хаосе, подготовить базу для внедрения ИИ и сложной аналитики.
Часто задаваемые вопросы
-
На чем базируются исследования СберАналитики?
Наши аналитика и исследования строятся на базе агрегированных и обезличенных данных Сбера и партнёров. Огромный массив информации, собираемый из 70+ внутренних и внешних источников с 2018 года. В основе наших исследований лежит огромный массив данных: 111 млн физлиц; 7,4 млн торговых точек; 1,1 тыс. городов; 6 млн организаций; все регионы России; 8 запатентованных разработок.
-
Могу ли я получить аналитику бесплатно?
Наша аналитика и доступ к продуктам предоставляются на платной основе (о наличии акционных предложений необходимо уточнять отдельно). По ряду продуктов возможны пробный период или демонстрация возможностей в рамках бесплатной консультации
-
Как быстро я получу доступ к своему продукту?
Наши исследования уникальны. Средний срок предоставления услуги на готовое исследование до 3-х дней. На сложное индивидуальное исследование - от 30 дней