Форус

Чек-лист: как правильно обезличить ПДн

<p style="text-align: justify;"> </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> Новые правила обезличивания персональных данных уже действуют. Разбираемся, как обезличить данные правильно и необратимо. Собрали всё в чек-лист. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: justify;"> <ul class="symbol-marker-list font-size-md"> <li>Прямые идентификаторы удалены</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> ФИО, телефоны, e-mail, паспорт/ИНН/СНИЛС, точный адрес, ID устройств/аккаунтов. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> выгрузите список полей и проверьте, что этих столбцов нет (или они очищены/заменены кодами, не связанными с реальными данными). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Инструменты:</b> Excel (фильтр по названию колонок), DLP/регэксп-поиск по шаблонам. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> в наборе нет явных персональных полей. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Ключи/словари сопоставления недоступны получателю</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это: </b>таблицы «реальный ID → анонимный ID», соли/seed, любые «ключи». </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> храните такие файлы <b>отдельно</b> в защищённой зоне; не пакуйте их вместе с датасетом; запретите доступ внешним лицам. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> получателю датасета невозможно восстановить исходные идентификаторы. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: justify;"> <ul class="symbol-marker-list font-size-md"> <li>Свободный текст очищен</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> поля «комментарий», «примечание», «описание» (там часто «утекают» ФИО/телефоны). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> прогоните текст через поиск шаблонов (телефон/e-mail/паспорт), удалите совпадения или замените масками. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Пример: </b>«Иванов И.И. +7-900-…» → «[скрыто]». </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> автоматическая проверка не находит ПДн в тексте. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: justify;"> <ul class="symbol-marker-list font-size-md"> <li>Квазиидентификаторы укрупнены</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> поля, по комбинации которых человека можно «вычислить» (возраст+район+должность и т. п.). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> </p> <ul class="line-marker-list font-size-md"> <li>Возраст → группы (напр., 18–24, 25–34, …).</li> <li>Дата → месяц/квартал/год (без дня).</li> <li>Адрес → только город/регион (без улицы/квартиры).</li> <li>Доход/сумма → диапазоны.</li> </ul> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> ни одно поле не даёт избыточной точности. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: justify;"> <ul class="symbol-marker-list font-size-md"> <li>Редкие значения подавлены</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это: </b>значения/категории, встречающиеся очень мало (в «хвостах»). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> посчитайте частоты; категории с частотой <b>&lt; n</b> (выберите порог, напр., &lt;10 записей) объедините в «Прочее» или укрупните до родительской группы. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> нет «редких» значений, по которым можно уникально опознать человека. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Перестановка/перемешивание применена (если уместно)</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> разрыв «сцепки» между полями (например, перетасуйте строки или некоторые атрибуты внутри группы). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> в выборках, где возможны уникальные сочетания, используйте перемешивание или микс-техники (swapping) внутри однородных сегментов (один город/класс). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если: </b>исходные «уникальные связки» разбиты. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Добавлен шум/бининг для числовых полей (где нужно)</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> небольшое контролируемое искажение чисел, либо перевод чисел в «бины» (диапазоны). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> суммы округляйте (до тысячи/десятков тыс.), длительности — до минут/часов, координаты — до района/квадрата. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> точные значения не восстанавливаются, а бизнес-метрики (тренды) сохраняются. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: justify;"> <ul class="symbol-marker-list font-size-md"> <li>k-анонимность ≥ 10 (рекомендуемо)</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> каждый «профиль» по выбранным квазиидентификаторам встречается минимум у 10 разных записей. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> </p> <ul class="line-marker-list font-size-md"> <li>Выберите набор квазиидентификаторов (напр., возрастная группа + пол + город).</li> <li>Постройте сводную таблицу и посчитайте размер каждой группы.</li> <li>Если группа &lt;10 — укрупняйте поля (см. пп. 4–7) и повторяйте.</li> </ul> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Инструменты:</b> Excel. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если: </b>минимальный размер группы ≥10. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Доля уникальных комбинаций &lt; 0,5% (или 0)</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это: </b>«одиночные» записи по выбранной комбинации квазиидентификаторов. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> по той же сводной таблице посчитайте процент групп с размером =1 от общего числа записей. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> ≤0,5% (или вовсе нет одиночек). При превышении — укрупнить поля/объединить редкие. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: justify;"> <ul class="symbol-marker-list font-size-md"> <li>Мини-группы отсутствуют</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> группы меньше порога k (напр., 2–9, если k=10). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> выявите такие группы и примените укрупнение/подавление (как в пп. 4–5). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> минимальная группа ≥k. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Линкейдж-оценка (попытка «сопоставить» с внешними источниками)</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> проверка, можно ли «сшить» ваш набор с открытыми данными/внутренними витринами и восстановить личности. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> выберите реалистичные внешние источники (открытые реестры, данные компании из другой системы), попробуйте сопоставить по общим полям (город+период+категория и т.п.). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если: </b>совпадения редки и ниже заданного порога; риск ре-идентификации низкий. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Метаданные/служебные поля очищены)</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это: </b>внутренние ID, пути к файлам, имена пользователей, комментарии, GUID, URL, хэши, которые могут «выдать» ключи. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> проверьте перечень колонок и свойства файла; удалите ненужные служебные поля. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> получатель не увидит служебных «следов» вашей системы. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Имена файлов и структура нейтральные</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это: </b>названия «client_ivanov.xlsx», «2025-07-HR-petrov.docx» – так делать нельзя. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> используйте нейтральные имена (например, dataset_A_v3_2025-08-10.parquet), без намёков на личности/ключи/службы. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если: </b>по имени файла нельзя догадаться о содержимом ПДн. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Запрещённые «единственные методы» не используются</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это: </b>нельзя считать анонимизацией «только шифрование» или «только хэш». </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать: </b>применяйте комбинацию методов из пп. 4-7; криптография может использоваться <b>дополнительно</b> для защиты, но не как способ обезличивания. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> обезличивание достигается содержательными методами (обобщение, подавление, перемешивание и т. д.). </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Артефакты собраны и сохранены</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> отчёт об анонимизации, список полей до/после, скрипты/версии, параметры биннинга/шума, контрольные суммы, результаты k-анонимности и доли уникальных, лог действий. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> сложите всё в защищённую папку/репозиторий; дайте названия, дату, версию. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> любой внутренний аудит сможет воспроизвести процесс. </p> <p style="text-align: justify;"> </p> <h2 style="text-align: left;"> <ul class="symbol-marker-list font-size-md"> <li>Подписи ответственных получены</li> </ul> </h2> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Что это:</b> финальный «допуск» на передачу. </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>Как сделать:</b> короткий лист согласования: владелец набора → ИБ/данные-сайентист → юрист/ответственный за ПДн → утверждающий (CISO/DPO). </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> <b>ОК, если:</b> все подписи/одобрения есть; канал выгрузки согласован. </p> <p style="text-align: justify;"> </p> <h4 style="text-align: left;">Шаблон для проверки в Excel </h4> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> Шаблон с автоподсчётом k-анонимности и уникальности – в <a href="https://t.me/pro152fz/38" target="_blank">Телеграм-канале</a> или <a href="https://max.ru/join/YdAIruDA7jZD21mLiwqPPCP1eePqRiqR_2SZA7PnJ3Q" target="_blank">MAX-канале</a>. Можно пройтись по пунктам чек-листа и поставить «ОК / НЕ ОК». </p> <p style="text-align: justify;"> </p> <h3 style="text-align: left;">Нужна помощь с обезличиванием данных?</h3> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"> Доверьте обезличивание профессионалам. Проверим ваши данные, подготовим отчёт, поможем соблюсти требования. </p> <p style="text-align: justify;"> </p> <div class="my-3"> <a href="/cifrovizaciya-gos-sektora/informatsionnaya-bezopasnost/zashchita-personalnykh-dannykh/" target="_blank" class="btn standart-btn me-4 py-2">Узнать подробнее</a> </div> <br> <p> </p> <p> </p>

Чек-лист: как правильно обезличить ПДн

ИТ-инфраструктура и безопасность
28.05.2026

Новые правила обезличивания персональных данных уже действуют. Разбираемся, как обезличить данные правильно и необратимо. Собрали всё в чек-лист.

  • Прямые идентификаторы удалены

Что это: ФИО, телефоны, e-mail, паспорт/ИНН/СНИЛС, точный адрес, ID устройств/аккаунтов.

Как сделать: выгрузите список полей и проверьте, что этих столбцов нет (или они очищены/заменены кодами, не связанными с реальными данными).

Инструменты: Excel (фильтр по названию колонок), DLP/регэксп-поиск по шаблонам.

ОК, если: в наборе нет явных персональных полей.

  • Ключи/словари сопоставления недоступны получателю

Что это: таблицы «реальный ID → анонимный ID», соли/seed, любые «ключи».

Как сделать: храните такие файлы отдельно в защищённой зоне; не пакуйте их вместе с датасетом; запретите доступ внешним лицам.

ОК, если: получателю датасета невозможно восстановить исходные идентификаторы.

  • Свободный текст очищен

Что это: поля «комментарий», «примечание», «описание» (там часто «утекают» ФИО/телефоны).

Как сделать: прогоните текст через поиск шаблонов (телефон/e-mail/паспорт), удалите совпадения или замените масками.

Пример: «Иванов И.И. +7-900-…» → «[скрыто]».

ОК, если: автоматическая проверка не находит ПДн в тексте.

  • Квазиидентификаторы укрупнены

Что это: поля, по комбинации которых человека можно «вычислить» (возраст+район+должность и т. п.).

Как сделать:

  • Возраст → группы (напр., 18–24, 25–34, …).
  • Дата → месяц/квартал/год (без дня).
  • Адрес → только город/регион (без улицы/квартиры).
  • Доход/сумма → диапазоны.

ОК, если: ни одно поле не даёт избыточной точности.

  • Редкие значения подавлены

Что это: значения/категории, встречающиеся очень мало (в «хвостах»).

Как сделать: посчитайте частоты; категории с частотой < n (выберите порог, напр., <10 записей) объедините в «Прочее» или укрупните до родительской группы.

ОК, если: нет «редких» значений, по которым можно уникально опознать человека.

  • Перестановка/перемешивание применена (если уместно)

Что это: разрыв «сцепки» между полями (например, перетасуйте строки или некоторые атрибуты внутри группы).

Как сделать: в выборках, где возможны уникальные сочетания, используйте перемешивание или микс-техники (swapping) внутри однородных сегментов (один город/класс).

ОК, если: исходные «уникальные связки» разбиты.

  • Добавлен шум/бининг для числовых полей (где нужно)

Что это: небольшое контролируемое искажение чисел, либо перевод чисел в «бины» (диапазоны).

Как сделать: суммы округляйте (до тысячи/десятков тыс.), длительности — до минут/часов, координаты — до района/квадрата.

ОК, если: точные значения не восстанавливаются, а бизнес-метрики (тренды) сохраняются.

  • k-анонимность ≥ 10 (рекомендуемо)

Что это: каждый «профиль» по выбранным квазиидентификаторам встречается минимум у 10 разных записей.

Как сделать:

  • Выберите набор квазиидентификаторов (напр., возрастная группа + пол + город).
  • Постройте сводную таблицу и посчитайте размер каждой группы.
  • Если группа <10 — укрупняйте поля (см. пп. 4–7) и повторяйте.

Инструменты: Excel.

ОК, если: минимальный размер группы ≥10.

  • Доля уникальных комбинаций < 0,5% (или 0)

Что это: «одиночные» записи по выбранной комбинации квазиидентификаторов.

Как сделать: по той же сводной таблице посчитайте процент групп с размером =1 от общего числа записей.

ОК, если: ≤0,5% (или вовсе нет одиночек). При превышении — укрупнить поля/объединить редкие.

  • Мини-группы отсутствуют

Что это: группы меньше порога k (напр., 2–9, если k=10).

Как сделать: выявите такие группы и примените укрупнение/подавление (как в пп. 4–5).

ОК, если: минимальная группа ≥k.

  • Линкейдж-оценка (попытка «сопоставить» с внешними источниками)

Что это: проверка, можно ли «сшить» ваш набор с открытыми данными/внутренними витринами и восстановить личности.

Как сделать: выберите реалистичные внешние источники (открытые реестры, данные компании из другой системы), попробуйте сопоставить по общим полям (город+период+категория и т.п.).

ОК, если: совпадения редки и ниже заданного порога; риск ре-идентификации низкий.

  • Метаданные/служебные поля очищены)

Что это: внутренние ID, пути к файлам, имена пользователей, комментарии, GUID, URL, хэши, которые могут «выдать» ключи.

Как сделать: проверьте перечень колонок и свойства файла; удалите ненужные служебные поля.

ОК, если: получатель не увидит служебных «следов» вашей системы.

  • Имена файлов и структура нейтральные

Что это: названия «client_ivanov.xlsx», «2025-07-HR-petrov.docx» – так делать нельзя.

Как сделать: используйте нейтральные имена (например, dataset_A_v3_2025-08-10.parquet), без намёков на личности/ключи/службы.

ОК, если: по имени файла нельзя догадаться о содержимом ПДн.

  • Запрещённые «единственные методы» не используются

Что это: нельзя считать анонимизацией «только шифрование» или «только хэш».

Как сделать: применяйте комбинацию методов из пп. 4-7; криптография может использоваться дополнительно для защиты, но не как способ обезличивания.

ОК, если: обезличивание достигается содержательными методами (обобщение, подавление, перемешивание и т. д.).

  • Артефакты собраны и сохранены

Что это: отчёт об анонимизации, список полей до/после, скрипты/версии, параметры биннинга/шума, контрольные суммы, результаты k-анонимности и доли уникальных, лог действий.

Как сделать: сложите всё в защищённую папку/репозиторий; дайте названия, дату, версию.

ОК, если: любой внутренний аудит сможет воспроизвести процесс.

  • Подписи ответственных получены

Что это: финальный «допуск» на передачу.

Как сделать: короткий лист согласования: владелец набора → ИБ/данные-сайентист → юрист/ответственный за ПДн → утверждающий (CISO/DPO).

ОК, если: все подписи/одобрения есть; канал выгрузки согласован.

Шаблон для проверки в Excel

Шаблон с автоподсчётом k-анонимности и уникальности – в Телеграм-канале или MAX-канале. Можно пройтись по пунктам чек-листа и поставить «ОК / НЕ ОК».

Нужна помощь с обезличиванием данных?

Доверьте обезличивание профессионалам. Проверим ваши данные, подготовим отчёт, поможем соблюсти требования.


Дополнительную информацию вы можете получить по телефону

+7 (3952) 78-00-00

Все статьи

Больше интересного

Крупный бизнес

Электронные документы должны сохранять юридическую значимость спустя годы. Разбираем, как организовать хранение документов, не перегружать рабочие системы и выстроить единый процесс работы с архивом.

ИТ-инфраструктура и безопасность

Проведите инвентаризацию ИСПДн, пока не пришёл Роскомнадзор. Пошаговая инструкция: от анализа бизнес-процессов до готового реестра, который спасёт от штрафов.

Малый и средний бизнес

В этой статье мы разберём, какие риски несёт утечка и какие шаги должен предпринять бизнес в соответствии с требованиями Федерального закона 152-ФЗ.

Хотите быть в курсе последних новостей?

Подпишитесь на рассылку: новости, акции, мероприятия и полезная информация. Подробнее о наших рассылках

Нажимая кнопку "Подписаться", вы соглашаетесь с политикой конфиденциальности

рассылка
Хотите быть в курсе последних новостей?

Подпишитесь на рассылку для руководителей: новости, акции, мероприятия и полезная информация.

Нажимая кнопку "Подписаться", вы соглашаетесь с политикой конфиденциальности

Этот сайт использует файлы куки для хранения данных. Продолжая использовать сайт, Вы соглашаетесь с Политикой обработки персональных данных.

Принимаю