Поиск дубликатов

Чтобы найти дубликаты необходимых записей:

  1. Нажмите “+ Добавить критерий” и выберите необходимые критерии, по которым будет произведен поиск. Доступен выбор нескольких критериев (Рисунок 1):

    • Идентификатор - поиск по ID эталонной записи. Доступен выбор наличия/отсутствия Пустого значения, а также ввод значения в текстовом поле: “Точное значение”, “Начинается с”, “Содержит”, “По сходству с” и уточнением критерия равный “=” или неравный “!=” (например, Содержит или Не содержит число “889”). Доступен выбор нескольких критериев, в таком случае применяется логика «ИЛИ».

    • Имя правила - поиск по правилам сопоставления (выпадающий список).

    • Имя набора правил - поиск по наборам правил (выпадающий список).

    • Пространство имен - поиск по месторасположению записей (реестрам/справочникам) или конкретному пространству (например, справочник “Страны”). Также доступен поиск по конкретным записям реестра/справочника (одной или нескольким).

  2. Нажмите кнопку “Найти”. В результате действия на экране отобразится таблица с найденными кластерами дублирующихся записей. Колонки таблицы отображают информацию о количестве найденных записей в кластерах и по каким правилам или наборам правил сопоставления сформированы кластеры (Рисунок 1).

  3. При необходимости поисковой запрос можно сохранить, нажав кнопку image0.

Tip

Управление критериями также доступно с помощью клавиатуры: навигация по списку критериев - с помощью стрелок клавиатуры; выбор критерия - клавиша Enter; переключение со списка критериев на панель настроек - клавиша Esc; переключение на следующий элемент панели - клавиша Tab

Таблица с кластерами дублирующихся записей и добавленными критериями поиска

Рисунок 1 – Таблица с кластерами дублирующихся записей и добавленными критериями поиска

Просмотр кластеров дубликатов записи также доступен при просмотре карточки записи в разделе Данные. На правой панели отображается перечень кластеров с общим количеством записей, в которых содержится текущая запись (Рисунок 2). Перейти в содержимое кластера можно, нажав на его имя.

Общий вид карточки записи с информацией о кластерах, в которых содержится текущая запись

Рисунок 2 – Общий вид карточки записи с информацией о кластерах, в которых содержится текущая запись

Для просмотра содержимого кластера:

  1. Нажмите на необходимую строку с именем кластера.

  2. В результате действия откроется выдвижная панель с подробной информацией о кластере: по какому правилу сопоставления или набору правил сформирован кластер, дате формирования и количестве записей в кластере (Рисунок 3). Ниже будет сформирована таблица с перечнем записей, вошедших в кластер дубликатов, состоящая из 5 столбцов:

    • Отображаемое имя - имя главного отображаемого атрибута записи.

    • ID записи - уникальный идентификационный номер записи.

    • Тип - тип пространства, в котором находится запись (реестр/справочник).

    • Название - название реестра/справочника, содержащего запись.

    • Коэффициент соответствия - уровень соответствия найденной записи настроенным правилам.

  3. Чтобы просмотреть карточку записи - нажмите на ID записи. В результате действия карточка записи откроется в новой вкладке браузера.

Выдвижная панель с содержимым кластера дубликатов

Рисунок 3 – Выдвижная панель с содержимым кластера дубликатов