Поиск дубликатов¶
Чтобы найти дубликаты необходимых записей:
Нажмите “+ Добавить критерий” и выберите необходимые критерии, по которым будет произведен поиск. Доступен выбор нескольких критериев (Рисунок 1):
Идентификатор - поиск по ID эталонной записи. Доступен выбор наличия/отсутствия Пустого значения, а также ввод значения в текстовом поле: “Точное значение”, “Начинается с”, “Содержит”, “По сходству с” и уточнением критерия равный “=” или неравный “!=” (например, Содержит или Не содержит число “889”). Доступен выбор нескольких критериев, в таком случае применяется логика «ИЛИ».
Имя правила - поиск по правилам сопоставления (выпадающий список).
Имя набора правил - поиск по наборам правил (выпадающий список).
Пространство имен - поиск по месторасположению записей (реестрам/справочникам) или конкретному пространству (например, справочник “Страны”). Также доступен поиск по конкретным записям реестра/справочника (одной или нескольким).
Нажмите кнопку “Найти”. В результате действия на экране отобразится таблица с найденными кластерами дублирующихся записей. Колонки таблицы отображают информацию о количестве найденных записей в кластерах и по каким правилам или наборам правил сопоставления сформированы кластеры (Рисунок 1).
При необходимости поисковой запрос можно сохранить, нажав кнопку .
Tip
Управление критериями также доступно с помощью клавиатуры: навигация по списку критериев - с помощью стрелок клавиатуры; выбор критерия - клавиша Enter; переключение со списка критериев на панель настроек - клавиша Esc; переключение на следующий элемент панели - клавиша Tab
Рисунок 1 – Таблица с кластерами дублирующихся записей и добавленными критериями поиска
Просмотр кластеров дубликатов записи также доступен при просмотре карточки записи в разделе Данные. На правой панели отображается перечень кластеров с общим количеством записей, в которых содержится текущая запись (Рисунок 2). Перейти в содержимое кластера можно, нажав на его имя.
Рисунок 2 – Общий вид карточки записи с информацией о кластерах, в которых содержится текущая запись
Для просмотра содержимого кластера:
Нажмите на необходимую строку с именем кластера.
В результате действия откроется выдвижная панель с подробной информацией о кластере: по какому правилу сопоставления или набору правил сформирован кластер, дате формирования и количестве записей в кластере (Рисунок 3). Ниже будет сформирована таблица с перечнем записей, вошедших в кластер дубликатов, состоящая из 5 столбцов:
Отображаемое имя - имя главного отображаемого атрибута записи.
ID записи - уникальный идентификационный номер записи.
Тип - тип пространства, в котором находится запись (реестр/справочник).
Название - название реестра/справочника, содержащего запись.
Коэффициент соответствия - уровень соответствия найденной записи настроенным правилам.
Чтобы просмотреть карточку записи - нажмите на ID записи. В результате действия карточка записи откроется в новой вкладке браузера.
Рисунок 3 – Выдвижная панель с содержимым кластера дубликатов