Загальский А.А., Дворянин Д.М. Подход для организации хранения данных для поддержки принятия врачебных решений // Научный результат. Информационные технологии. - Т.5, №2, 2020
УДК 519.81
DOI: 10.18413/2518-1092-2020-5-2-0-7
Загальский А. А.1&2 Дворянин Д.М.2
ПОДХОД ДЛЯ ОРГАНИЗАЦИИ ХРАНЕНИЯ ДАННЫХ ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ
e-mail: 1051445@bsu.edu.ru
Аннотация
В статье рассматривается разработка хранилища медицинских данных, в котором имеется возможность накапливать медицинскую информацию о секторе здравоохранения и инструмент отчетности, основанный на графическом представлении информации. За счет обеспечения связи между кубом данных и инструментом отчетности, медицинские работники и лица принимающие решения могут в реальном времени использовать систему поддержки принятия решений.
UDC 519.81
Zagalsky A.A.1&2 Dvoruanin D.M.2
APPROACH TO ORGANIZING DATA STORAGE TO SUPPORT DOCTOR DECISIONS
e-mail: 1051445@bsu.edu.ru
Abstract
In this study, we designed and implemented a decision support system which would improve health care in Bejaia department to especially assist in the selection of the optimum location of health center and hospital, the specialty of the health center, the medical equipment and the medical staff.
ВВЕДЕНИЕ
Развивающиеся страны, особенно наименее развитые, испытывают острую нехватку инфраструктуры здравоохранения и медицинского персонала. Принятие решений об альтернативном использовании ресурсов здравоохранения является проблемой, крайне важной для правительств и администраторов всех систем здравоохранения. Эта ситуация побуждает губернаторов и политиков к поиску решений. Система поддержки принятия медицинских решений - это система информационных технологий здравоохранения, которая помогает врачам и другим медицинским работникам оказывать поддержку в принятии клинических решений. Технологию хранилищ данных, это один из самых распространенных способов создания системы поддержки принятия решений
Технология хранилища данных - это набор данных, организованных для использования в качестве поддержки принятия решений, таких как данные, характеризуемые следующими факторами: данные организованы по темам или тематикам, собирая всю информацию,
У J jy ТТзТУ^Т Загальский A.A., Дворянин Д.М. Подход для организации хранения данных для
Т~)1—"&_}\\7"7~ТТ Т1 ДТ1 поддержки принятия врачебных решений // Научный результат.
Г Г.. ) j J 1С) X /Л 1 Информационные технологии. - Т.5, №2, 2020
■ >■ W М, Г N »мл Т^^Ш
относящуюся к конкретной теме, облегчая принятие решений; данные в основном используются в режиме консультаций и реже обновляются или удаляются пользователями, что сохраняет прослеживаемость информации, выполняя анализ в течение длительного времени.
Интеграция данных устраняет все конфликты представлений; синтаксические и семантические, чтобы получить единообразное и согласованное представление данных при загрузке данных в хранилище данных.
Основное внимание в исследовании было уделено созданию системы поддержки принятия решений, которая осуществляет распределение медицинских ресурсов сектора здравоохранения. На самом деле, медицинское учреждение находится в постоянном росте, контроль и мониторинг такой эволюции требует эффективного решения. В статье описан дизайн и реализация хранилища данных, которое используется для предоставления информации аналитикам и управленцам. Целью проектирования и создания такой системы было создание платформы для распределения медицинских ресурсов, предоставляя лицам, принимающим решения, четкую информацию о данных сектора здравоохранения. Это поможет лицам, принимающим решения, принимать более обоснованные решения относительно расположения медицинских центров и их специальностей, планов набора медицинского персонала.
ОСНОВНАЯ ЧАСТЬ
В работе используется технология инструмента хранилища данных, основанная на реляционной базе данных. Проектирование базы данных осуществлялось по многомерной модели. Реализация хранилища данных осуществлялась с использованием SQL-сервера. Инструменты отчетности были выполнены с использованием MS Excel и набора программ Microsoft Visual Basic (VBA), предназначенных для автоматического запроса базы данных.
Проектирование и внедрение хранилища данных было сложной задачей, состоящей из нескольких этапов: определение требований, анализ и извлечение источников данных, интеграция, загрузка в хранилище и создание различных инструментов отчетности (анализ, анализ данных или запросы). В этом проекте были определены два вида требований: функциональные требования, которые предназначались для поиска информации для принятия решений о заболеваниях и пациентах и медицинских центрах, таких как информация о пациенте, название и тип заболеваний, характер заболеваний во времени или на месте, и соответствующее оборудование или палата. Нефункциональные требования, которые должны были обеспечить скорость обработки, производительность и безопасность.
Источники данных и исследование населения
Для извлечения данных из нескольких разнородных и распределенных источников требуется синхронизация процессов извлечения для обеспечения целостности данных. Эти источники могут включать базы данных, файлы данных, внешние источники и т. д. Перед сохранением источники данных должны быть сначала очищены. Процесс очистки заключался в отборе и очистке данных для устранения проблем и согласования семантических различий между этими данными. В нашем случае данные поступали из нескольких источников информационных систем, в которых хранились данные о пациентах отделения. Таким образом, вся информация о пациентах, врачах, их адресах, заболеваниях, дате посещения и посещенном медицинском центре должна храниться в таблицах, представленных на рисунке 1. Следующим шагом была модель данных, которая требовалась для удовлетворения запланированных потребностей и была легко расширяемой для удовлетворения будущих потребностей.
Загальский А.А., Дворянин Д.М. Подход для организации хранения данных для поддержки принятия врачебных решений // Научный результат. Информационные технологии. - Т.5, №2, 2020
Patient Period Health-ward
patient id patient sex, patient age patient address, Period id Period duration Period _.beg_day Period beg month Period beg Year Ward id Hospital Id Ward specialty Ward capacity Equipment quality
Disease Doctor Location
Disease id Disease name Disease type Disease symptom Doctor id Recruitment dat Degree Specialty Location id Street City Town
Рис. 1. Таблицы данных Fig. 1. Data tables
Моделирование подготовки данных
Диаграммы сущности-отношения и методы нормализации широко используются для проектирования баз данных для хранилищ данных. Тем не менее, схемы баз данных, рекомендованные диаграммами Entity-Relationship, были неподходящими для систем поддержки принятия решений, где важна эффективность запросов и загрузки данных. Таким образом, было решено использовать многомерную модель данных, а именно звездообразную схему. Действительно, в схеме «звезда» база данных состояла из одной таблицы фактов и одной таблицы для каждого измерения. Каждый кортеж в таблице фактов состоял из указателя (внешний ключ -часто используется сгенерированный ключ для эффективности) для каждого из измерений, которые предоставили свои многомерные координаты и сохранили числовые меры для этих координат. Каждая таблица измерений состояла из столбцов, соответствующих атрибутам измерения. Материализованные представления были выбраны для хранения интегрированных данных таблиц измерений. Фактически, материализованное представление - это объект базы данных, который содержит результаты запроса или дублирование одной или нескольких таблиц. Как правило, мы использовали материализованное представление, поскольку оно позволяло изменять его различными способами: (чтобы изменить его характеристики хранения, изменить его режим или время обновления. Изменить его структуру так, чтобы это был другой тип материализованного представления). Действительно, в нашем случае некоторая информация о пациентах и медицинском персонале может со временем меняться. Следовательно, использование метода обслуживания представления может устранить проблему изменения данных.
Как показано на рисунке 2 таблица показателей содержала в основном три информационные части: первичный ключ «Measure_id», внешние ключи, Patient_id, Doctor_id, Disease_id, Location_id, Period_id, Ward_id »и набор мер, таких как количество пациентов в данном месте и период. Набор таблиц, представленный ранее, использовался для создания схемы типа «звезда», показанной на рисунке 3, Центром звезды является таблица фактов, а точками края звезды являются таблицы измерений «Пациент, Доктор, Болезнь, Период, местоположение и здоровье». Денормализованная структура таблиц измерений в схемах типа «звезда» больше подходит для просмотра размеров.
Загальский А.А., Дворянин Д.М. Подход для организации хранения данных для поддержки принятия врачебных решений // Научный результат. Информационные технологии. - Т.5, №2, 2020
Measures
^ Measure id J>- Primary ke\\
Patient Id Ward id. Disease id Location id Period id Measure (1) Measure (2) Measure (3) - >-Foreign kevs
-Measures
Рис. 2. Таблица показателей Fig. 2. Scorecard
Рис. 3. Схема звезды Fig. 3. The star schema
Преобразование данных
Преобразование данных - это набор правил для форматирования и преобразования извлеченных данных из одного формата (например, файла базы данных, документа XML или листа Excel) в соответствии со схемой целевого хранилища, например, назначение семантики для источников данных и объединение исходных полей в целевые поля. Таким образом, преобразование состояло в том, чтобы отобразить входящие данные из разных источников в формате хранилища данных. Были использованы некоторые методы, такие как объединение нескольких полей имени в одно поле или разбиение полей, создание отображения, которое должно
Загальский А.А., Дворянин Д.М. Подход для организации хранения данных для поддержки принятия врачебных решений // Научный результат. Информационные технологии. - Т.5, №2, 2020
было определить взаимосвязь между элементами данных двух приложений. Были обновлены некоторые имена столбцов в другие имена и преобразованы из одного типа данных в другой.
Загрузка данных была последним этапом процесса ETL. Он состоял из загрузки данных в хранилище данных для аналитических целей. Информация о создании, управлении и использовании хранилища, об источниках и их содержимом, схеме хранилища, правилах обновления, профилях и группах пользователей также хранилась в отдельном каталоге. Эта информация называлась «Метаданные». Хранилище данных было посвящено анализу решений в стиле OLAP. Он обеспечивает доступ к хранилищу, преобразует запросы клиентов на доступ к DW и предоставляет многомерные представления данных для поддержки инструментов принятия решений. Многомерная модель поддерживала OLAP-дизайн для обеспечения мгновенных результатов аналитических запросов.
Для облегчения анализа данных OLAP преобразовал медицинские данные, хранящиеся в реляционной базе данных, в релевантную медицинскую информацию и упростил управление, создав куб данных. Целью этого шага была разработка нашей многомерной базы данных для кубов OLAP. Поэтому для проектирования нашего склада мы использовали MOLAP (многомерный OLAP) вместе с языком T-SQL. Поскольку у нас было шесть измерений, и у каждого измерения было как минимум четыре атрибута, возможно, было несколько кубов в зависимости от выбранных измерений. Куб данных был идентифицирован тремя измерениями или атрибутом измерения. Рисунок 4 показывает представление куба данных с использованием измерений: болезнь (D1, D2, D3 и D4), период (P1, P2, P3 и P4) и местоположение (L1, L2, L3 и L4).
Рис. 4. Куб данных Fig. 4. Data cube
Реализация хранилища данных
Основываясь на нескольких параметрах, таких как: инструменты администрирования, защита от перебора, развертывание и обслуживание, конфиденциальность и целостность данных, контроль параллелизма, графический интерфейс пользователя, резервное копирование и восстановление данных, доступность и мастерство программного обеспечения, мы сравнили несколько инструментов построения хранилища данных: Oracle , Pentaho, Talend Open Studio и SQL Server. Последнее было выбрано для построения хранилища данных, и с помощью Microsoft Excel мы создали инструменты отчетности.
Целью нашей системы поддержки принятия медицинских решений было решение нескольких проблем, которые охватывали несколько аспектов: общественное здравоохранение, финансы, экономика и управление сектором здравоохранения. Это позволило нам дать важные
Загальский А.А., Дворянин Д.М. Подход для организации хранения данных для T~)l—"&_}\\7"7~TT """TAT"1 поддержки принятия врачебных решений // Научный результат.
Информационные технологии. - Т.5, №2, 2020
„ W М, Г N »мл Т^^Ш
ориентиры на этапах планирования общественного здравоохранения, иметь полное прогнозирующее видение за счет лучшего перераспределения предложений по уходу (специализации больниц, распределение и распределение медицинского оборудования, количество специалистов в каждой больнице, количество коек в зависимости от местоположения, количество коек по специальности) эти предложения необходимо регулярно корректировать с изменением интересов (изменение процедур благополучия, болезни, структуры благополучия, возраст населения и адрес населения). Наше хранилище данных поможет лицам, принимающим решения, принять решение о выборе цели, что приведет к значительному снижению стоимости,
Защита личной информации о пациентах. Имя, фамилия, место и дата рождения пациентов были удалены из нашей системы. Их заменили идентификацией и возрастом пациента. Только те, кто был вовлечен в непосредственное развитие системы и предоставление медицинской помощи, и медицинские руководители имели доступ к элементам медицинской информации. Передача данных в хранилище данных была разработана для того, чтобы происходить после подавления индивидуальной идентификационной информации пациентов.
Результаты
Было создано хранилище медицинских данных, в котором мы накапливали медицинскую информацию о секторе здравоохранения и инструмент отчетности, основанный на графическом представлении информации. Обеспечивая связь между нашим кубом данных и инструментом отчетности, медицинские работники и лица, принимающие решения, могут легко и в реальном времени использовать систему поддержки принятия решений.
Пользователи могут получить отчеты по нескольким медицинским параметрам, которые будут проанализированы. Таким образом, система будет оказывать помощь и сообщать, например, об оптимальном месте для строительства или расширения медицинских центров по данной специальности.
ЗАКЛЮЧЕНИЕ
Система поддержки принятия медицинских решений является одной из наиболее перспективных областей, и для ее легкого внедрения разрабатываются новые технологии. В этой статье мы описали подход к концептуальному проектированию хранилища данных, которое управляет и координирует медицинские ресурсы. Предлагаемая система поддержки принятия решений дает много информации об эпидемиологии и здравоохранении, о различных заболеваниях, их концентрации. Он показывает возрастные классы, периоды и области, затронутые конкретной болезнью и т. д.
Список литературы
J J jû^ ^^ TT ТТзТ^Г Загальский А.А., Дворянин Д.М. Подход для организации хранения данных для
Т~)1—"&_}\\7"7~ТТ Т1 ДТ1 поддержки принятия врачебных решений // Научный результат.
Г Г.. ) j J 1С) X /Л 1 Информационные технологии. - Т.5, №2, 2020
■ >■ W М, Г N »мл Т^^Ш
References
J J УУ ТТзТУ^Г Загальский А.А., Дворянин Д.М. Подход для организации хранения данных для
Т~)1—"&_}\\7"7~ТТ Т1 ДТ1 поддержки принятия врачебных решений // Научный результат. Г Г.. ) j J 1С) 1 /Л 1 Информационные технологии. - Т.5, №2, 2020
■ >■ W М, Г N »мл Т^^Ш
Загальский Анатолий Анатольевич, системный администратор областного государственного автономного учреждение здравоохранения «Детская стоматологическая поликлиника города Белгорода», магистрант Белгородского государственного национального исследовательского университета»
Дворянин Дмитрий Михайлович, магистрант Белгородского государственного национального исследовательского университета»
Zagalsky Anatoly Anatolyevich, System Administrator of the Regional State Autonomous Healthcare Institution "Children&s Dental Clinic of the City of Belgorod", Master of the Belgorod State National Research University Dvoryanin Dmitry Mikhailovich, master of «Belgorod State National Research University»