4.4 Правила оформления и хранения данных

Достижение преемственности в работе с данными, возможность проведения анализа любым заинтересованным специалистом и своевременность внесения исправлений – все это основывается на разработке и соблюдении правил оформления и хранения данных. Ключевые подходы к оформлению данных напрямую связаны с наиболее частыми ошибками, которые возникают в зависимости от типа данных: количественных, качественных (текстовых) и дат. При этом в большинстве случаев ошибки обусловлены отсутствием единообразия записи данных [65] .

4.4.1 Основные требования к таблице

  1. Таблица плоская (ячейки не объединяются между собой, нет дополнительных подстрок).
  2. У таблицы должна быть заголовочная строка (строка с названиями столбцов).
  3. Каждый изолят следует записывать на отдельной строке.
  4. Формат сохраненной таблицы – .xlsx или .csv. Объединенные требования к оформлению таблицы и записям в ячейках представлены в разделе 4.2. Шаблон для сбора и ввода данных.

4.4.2 Основные требования к записям в ячейке

Согласно концепции AMRcloud данные разделяются на обязательные и дополнительные.

4.4.2.1 Обязательные данные

  • Идентификатор изолята (ID_изолята),
  • Название вида микроорганизма,
  • Название группы микроорганизмов,
  • Дата,
  • Результат определения чувствительности к антимикробному препарату (АМП).

Рекомендации по оформлению идентификационного номера изолята

В качестве идентификатора изолята необходимо использовать уникальные номера с целью однозначного определения принадлежности изолята. Идентификатор может быть буквенными или числовыми. Следует исключать специальные символы (?,!%$#<>).

Рекомендации по оформлению названий вида микроорганизма

Полный вариант написания вида микроорганизма позволяет автоматически применить критерии интерпретации. Сокращения в названии вида недопустимы.

Рекомендации по оформлению названия группы микроорганизмов

Оформление этого параметра рекомендуется выполнять с использованием англоязычного варианта. Название группы микроорганизмов может быть сокращено, но сокращения необходимо сделать стандартными (одинаковыми по всему столбцу).

Рекомендации по оформлению дат

Обязательным «столбцом-датой» является дата взятия материала. Однако представленные правила рекомендуется использовать для всех дат, вносимых в таблицу (дата взятия материала, дата поступления пациента в стационар, дата рождения и т.д.). Ключевым условием является универсальность написания во всех строчках: т.е. если выбран вариант ДД.ММ.ГГГГ, необходимо использовать только его.

Пример: 12.02.2015; 08.01.2015; 29.12.2014

Рекомендации по оформлению наименований антимикробных препаратов и результатов определения чувствительности:

  • результат определения чувствительности к каждому АМП – отдельный столбец;
  • алфавит английского языка;
  • исключение кириллицы;
  • исключение специальных символов (?,!%$#);
  • генерическое название АМП (полный вариант написания). Список наименований представлен в разделе 6.2. Работа с шаблоном, справочниками и словарями;
  • указание в наименовании АМП методов определения чувствительности с помощью идентифицирующих суффиксов.

Таблица 4.4.1. Идентифицирующие суффиксы для обозначения методов определения чувствительности

Метод тестирования Суффикс
Значения минимальных подавляющих концентраций (МПК) - мг/л _mic
Диаметры зон подавления роста - мм _dd
Категории чувствительности (S/I/R) - значения заранее определяются пользователем _sir

4.4.2.2 Количественные (МПК и ДД) и категориальные (S/I/R) данные оценки чувствительности. Важность количественных данных

Данные минимальных подавляющих концентраций

Результаты, которые получены с применением автоматизированных систем, ручных панелей разведений или градиентной диффузии (полоски). Для AMRcloud это столбцы с результатами определения чувствительности вида: antibiotic_mic.

Особенностями столбцов с МПК являются:

  • измерения в мг/л;
  • для комбинированных препаратов – внесение значений МПК только для первого препарата в комбинации;
  • преобразование в AMRcloud значений со знаками: <=, >=, >

Варианты изменений представлены в таблице 4.4.2.

Таблица 4.4.2. Возможные преобразования значений МПК в AMRcloud

Исходное значение Результат преобразования в AMRcloud Пример
<= число число Исходная таблица <=2
В AMRcloud 2
>= число число Исходная таблица >=16
В AMRcloud 16
> число число х2 Исходная таблица >16
В AMRcloud 32

Данные диаметров зон подавления роста

Результаты, которые получены с применением диско-диффузионного метода. Для AMRcloud это столбцы с результатами определения чувствительности вида: antibiotic_dd.

Особенностью столбцов с диаметров зон подавления роста является:

  • диапазон целых числовых значений от 6 до 50 мм.

Данные категорий чувствительности

Результаты, которые получены после применения критериев интерпретации с последующим внесением в таблицу (т.е. неколичественные значения). Для AMRcloud это столбцы с результатами определения чувствительности вида: antibiotic_sir.

Особенностями столбцов с категориями чувствительности является:

  • указание одного типа чувствительности: S или I или R;
  • невозможность использования при изменении критериев интерпретации.

Таким образом, количественные данные категоризируются (определение категории S/I/R) согласно пороговым значениям, указанным в правилах интерпретации. Ежегодно интерпретационные правила пересматриваются и дополняются. Если результаты представлены в виде уже «готовых» категорий (S/I/R), невозможно адекватно сопоставить исторические данные (например, данные прошлого года) с текущими. Поэтому для организации мониторинга настоятельно рекомендуется использовать именно количественные данные, так как к ним всегда можно применить актуальные на данный момент интерпретационные критерии (в том числе к историческим данным). Это обеспечит преемственность и сопоставимость результатов.

4.4.2.3 Дополнительные данные

Любое инфекционное заболевание характеризуется набором отличительных характеристик, которые могут занимать важное место в итоговых эпидемиологических данных. Эти свойства относятся к метаданным (дополнительной информации о содержимом, т.е. изоляте). Включение метаданных позволяет оценить их важность в эпидемиологическом процессе, а также помогает выявлению «скрытых» причинно-следственных связей. Основные группы метаданных представлены в разделе 4.3. Сопроводительная эпидемиологическая, клиническая и демографическая информация.

Ключевыми требованиями к записи в ячейке являются: исключение специальных символов (?,!%$#<>) и использование единых обозначений. В исходной таблице общее количество столбцов с дополнительными данными может быть любым. При загрузке в AMRcloud установлены следующие требования:

  • Отметки изолятов – количество столбцов неограниченно.
  • География, информация по заболеванию, информация по пациенту – до 12 показателей + 1 количественный параметр (например, возраст или вес пациента, или длительность госпитализации и т.д.).

Рекомендации по оформлению данных пациента

В группу таких данных могут быть включены различные показатели, например:

  • Возраст пациента (количественный параметр);
  • Пол пациента (универсальное оформление по всему столбцу);
  • Локализация инфекции (универсальное оформление по всему столбцу, сокращенный или полный вариант написания);
  • Клинический материал (универсальное оформление по всему столбцу, сокращенный или полный вариант написания) [66] .

В исходной таблице количество таких столбцов с пациент-ориентированной информацией неограниченно. При загрузке в AMRcloud количественный параметр может быть только один. Варианты записи показателей представлены в разделе 4.2. Шаблон для сбора и ввода данных и в разделе 6.2. Работа с шаблоном, справочниками и словарями.

Рекомендации по оформлению географических данных

Группа показателей «География» может включать данные конкретного географического объекта – медицинской организации (название, корпус и/или отделение), а также город [67] . Геокодирование, т.е. определение географических координат, в AMRcloud происходит путем автоматического поиска совпадений «географический объект – широта | долгота». Необходимость определения координат вручную понадобится в нескольких ситуациях:

  1. Таблица с географическими объектами (название, корпус и/или отделение) загружаются в AMRcloud впервые и/или координаты не сохранялись для повторного использования. Подробнее о сохранении координат и их просмотре в 5.4. Актуализация информации.
  2. Координаты автоматически проставлены, но выявлены опечатки/неточности.

Ключевым требованием является универсальность написания: если использовалась аббревиатура/сокращение названия географического объекта, то их не следует менять на полное название.

Примеры написания географических объектов представлены в разделе 4.2. Шаблон для сбора и ввода данных.

Рекомендации по оформлению данных «по заболеванию»

Основным требованием является единое оформление всех показателей. Особыми маркерами заболевания могут быть симптомы, требующие регистрации среди группы пациентов (наличие лихорадки, маркеров воспаления, результатов оценки тяжести состояния пациента по соответствующим шкалам – qSOFA, NEWS, APACHE II и т.д.).

Рекомендации по оформлению данных «отметки изолятов»

Для данной группы показателей характерны следующие особенности:

  • Общее количество маркеров не ограничено;
  • Возможно создание пользователем собственной «группировки маркеров»;
  • Указываются генетические маркеры, особые фенотипы, факторы вирулентности.

При работе с такими показателями необходимо придерживаться правил, которые могут быть отражены в справочнике к локальной системе мониторинга. Возможный алгоритм заполнения предложен на рисунке 1.

Вариант заполнения данной группы показателей представлен в разделах 3.7. Методы выявления механизмов резистентности, имеющих клиническое и эпидемиологическое значение и 4.2. Шаблон для сбора и ввода данных.

Алгоритм заполнения ячеек с показателями: генетических маркеров/особых фенотипов/факторы вирулентности

Изменено 27 сентября 2021