Правила сопоставления

Общая информация

Правила сопоставления используются для поиска дублирующихся данных по определенным признакам и для формирования кластеров с дубликатами. Правила сопоставления имеют гибкую настройку элементов сопоставления, возможность выбора источника информации и алгоритмов сравнения данных.

Сопоставление записей основано на атрибутах первого уровня (простых и кодовых типов). Сопоставление записей, содержащих связи, возможно только через создание кастомного потока выполнения.

Настройка правил сопоставления производится в следующем порядке:

  • Таблицы сопоставления - формирование списка элементов сопоставления. Этот список используется при создании набора правил.

  • Правила сопоставления - создание правила, использующего определенный тип хранилища данных и набор алгоритмов сравнения.

  • Наборы правил - создание набора правил, объединенного общим типом хранилища и использующего таблицы сопоставления.

  • Назначение правил - назначение таблицы сопоставления и набора правил конкретным атрибутам реестров/справочников.

В соответствии с настройками правил формируются кластеры дублирующихся записей. Список кластеров и их содержимое можно посмотреть в разделе Дубликаты интерфейса оператора данных. Состав кластеров обновляется при редактировании / удалении записи в реальном времени или при запуске операции переиндексации данных (зависит от того, какие Потоки выполнения настроены).

Также смотрите Концепция поиска дубликатов.

Запуск правил

Запуск правил сопоставления с помощью потоков выполнения:

  1. В разделе Параметры системы интерфейса администратора системы включите флаг Real-time сопоставление данных (секция Настройки сопоставления данных).

  2. В разделе Потоки выполнения интерфейса администратора системы настройте поток выполнения сопоставления данных.

  3. Настройте механизмы сопоставления в следующей последовательности: Создайте таблицы сопоставления → Создайте правила сопоставления → Создайте наборы правил → Назначьте правила на реестр/справочник.

  4. Посмотрите результаты в разделе Дубликаты.

Запуск правил сопоставления с помощью операции переиндексации данных:

  1. Настройте механизмы сопоставления в следующей последовательности: Создайте таблицы сопоставления → Создайте правила сопоставления → Создайте наборы правил → Назначьте правила на реестр/справочник.

  2. В разделе “Операции” интерфейса администратора системы создайте и запустите операцию переиндексации (reindexDataJob) с включенным параметром Обновить данные таблиц сопоставления.

  3. Посмотрите результаты в разделе Дубликаты.