Правила сопоставления¶
Общая информация¶
Правила сопоставления используются для поиска дублирующихся данных по определенным признакам и для формирования кластеров с дубликатами. Правила сопоставления имеют гибкую настройку элементов сопоставления, возможность выбора источника информации и алгоритмов сравнения данных.
Сопоставление записей основано на атрибутах первого уровня (простых и кодовых типов). Сопоставление записей, содержащих связи, возможно только через создание кастомного потока выполнения.
Настройка правил сопоставления производится в следующем порядке:
Таблицы сопоставления - формирование списка элементов сопоставления. Этот список используется при создании набора правил.
Правила сопоставления - создание правила, использующего определенный тип хранилища данных и набор алгоритмов сравнения.
Наборы правил - создание набора правил, объединенного общим типом хранилища и использующего таблицы сопоставления.
Назначение правил - назначение таблицы сопоставления и набора правил конкретным атрибутам реестров/справочников.
В соответствии с настройками правил формируются кластеры дублирующихся записей. Список кластеров и их содержимое можно посмотреть в разделе Дубликаты интерфейса оператора данных. Состав кластеров обновляется при редактировании / удалении записи в реальном времени или при запуске операции переиндексации данных (зависит от того, какие Потоки выполнения настроены).
Также смотрите Концепция поиска дубликатов.
Запуск правил¶
Запуск правил сопоставления с помощью потоков выполнения:
В разделе Параметры системы интерфейса администратора системы включите флаг Real-time сопоставление данных (секция Настройки сопоставления данных).
В разделе Потоки выполнения интерфейса администратора системы настройте поток выполнения сопоставления данных.
Настройте механизмы сопоставления в следующей последовательности: Создайте таблицы сопоставления → Создайте правила сопоставления → Создайте наборы правил → Назначьте правила на реестр/справочник.
Посмотрите результаты в разделе Дубликаты.
Запуск правил сопоставления с помощью операции переиндексации данных:
Настройте механизмы сопоставления в следующей последовательности: Создайте таблицы сопоставления → Создайте правила сопоставления → Создайте наборы правил → Назначьте правила на реестр/справочник.
В разделе “Операции” интерфейса администратора системы создайте и запустите операцию переиндексации (reindexDataJob) с включенным параметром Обновить данные таблиц сопоставления.
Посмотрите результаты в разделе Дубликаты.