ПРИМЕНЕНИЕ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ДЛЯ ОЦЕНКИ ЗАБОЛЕВАЕМОСТИ ДЕТЕЙ С ПЕРИНАТАЛЬНЫМ ПОРАЖЕНИЕМ ЦЕНТРАЛЬНОЙ НЕРВНОЙ СИСТЕМЫ

 

З.Ф. Акинина***, Г.О. Куликова***, С.В. Кучерявский**, А.И. Пиянзин*, С. В. Суханов*** А.В.Федоров*, А.С. Шатохин**, А.И Щербаков**

 

В связи с ухудшением социально-демографической ситуации в России, перед медициной стоит задача всестороннего анализа проблем формирования здоровья населения. При этом детской заболеваемости отводится ведущая роль в оценке общественного здоровья [1]. Разработка подходов по изучению заболеваемости является актуальной проблемой [2]. Современные информационные технологии позволяют более эффективно анализировать данные о заболеваемости населения. Однако применение традиционных методов к большим объемам медицинских данных не всегда позволяет получить адекватные результаты, при этом велика вероятность наличия выбросов, обусловленных ошибками при сборе информации. В связи с этим, для описания и анализа структуры полученных данных, а так же для поиска скрытых зависимостей удобно использовать проекционные методы анализа многомерных данных, такие как, например, метод главных компонент (МГК) и проекция на латентные структуры (ПЛС) [3].

Цель - изучение заболеваемости у детей, имевших в анамнезе перинатальное поражение ЦНС, путем методов анализа многомерных данных и математической статистики.


Материалы и методы. В разработку были включены данные истории развития ребенка (форма N 112/У). Ретроспективно на каждом году жизни ребенка (от рождения до 12 лет) подсчитывали количество детей, имевших определенное заболевание (в соответствии с Международной классификацией болезней 10 пересмотра - МКБ-10) и количество обращений по данной патологии. Были выделены 4 группы детей с определенной клинической формой перинатального поражения ЦНС (ППЦНС): I - гипоксически-ишемическое поражение головного мозга, II - гипоксически-геморрагическое поражение головного мозга, III - поражение спинного мозга, IV - натальная кранио-спинальная травма. Выбор групп вели в соответствии с классификацией перинатальных поражений нервной системы у новорожденных, утвержденной VI Конгрессом педиатров России [4]. Диагноз поставлен в отделении психоневрологии новорожденных Алтайской краевой клинической детской больницы г. Барнаул. Контрольную группу составили дети без перинатального поражения ЦНС. Дети после рождения проживали в сельской местности и находились в одинаковых социальных условиях. Полученные данные представляли собой 2-мерную матрицу N´P, в которой N - число строк (образцов), которым соответствовали группы здоровых и больных детей, разделенных по возрастам, P - число столбцов (переменных), в качестве которых использовались диагнозы. Общий объем составил 97´500 значений.

В качестве методов анализа данных были выбраны метод главных компонент (МГК) и критерий c2, использовавшийся для поиска характерных для определенного возрастного периода заболеваний у лиц, имевших перинатальное поражение ЦНС при рождении. Для конкретного возраста с помощью критерия c2 выявлялись статистически значимые различия частоты изучаемого признака.

 

 

Рис. 1. Графики счетов и нагрузок результатов анализа МГК для младшей возрастной группы (1-3 года)

 

Результаты исследования. По возрастной периодизации развития детей все данные были сформированы в три группы - от 1 до 3 лет (младшая группа), от 4 до 6 лет (дошкольники) и от 7 до 11 лет (младшие школьники) [5]. Графики счетов (scores) и нагрузок (loadings) для одной из возрастных групп представлены на рис 1. Здесь в качестве обозначений использовалась схема X.M.N, где X - принимает значения b - для детей с ПП ЦНС и z - для детей без ППЦНС, M - номер группы по диагнозу ППЦНС, N - возраст. Например, - z4.2 - ребенок без ППЦНС при рождении, 4 - клиническая форма ППЦНС, 2 - возраст ребенка. J00, J06 - шифры по МКБ-10.

 

А

 

Б

 

В

 

Г

 

Рис.2. Графики счетов (А, В) и нагрузок (Б, Г) итогов анализа МГК без учета ОРВИ для младшей (А, Б) и средней (В,Г) возрастных групп

 

Первая главная компонента (она представлена на рис.1 осью абсцисс) отвечает за разделение между детьми, имеющими ПП ЦНС и без данной патологии при рождении, в то время как вторая компонента (ось ординат) - отвечает за возрастные характеристики. График счетов для младшей возрастной группы показывает, как четкое различие между точками, принадлежащими группам детей с ППЦНС и без него, так и четкое различие по возрасту. Это позволяет сделать вывод о том, что в раннем возрасте каждому годовому периоду соответствуют характерные заболевания, в то время как для старшей возрастной группы четкое различие стирается. График нагрузок показывает наиболее отличительные диагнозы, влияющие на различие между группами. После анализа графиков для других возрастных групп выявлено, что наибольшее влияние во всех группах имеет острая респираторно вирусная инфекция (ОРВИ). Для того чтобы дать более


качественный анализ результатам МГК, результаты были пересчитаны без влияния данного признака (рис. 2). Заметим, что исключение ОРВИ практически не отразилось на различии между точками, соответствующими детям с ППЦНС и без данной патологии. Так как модель была центрирована практически на всех графиках счетов точки, соответствующие больным и здоровым пациентам, расположены по разные стороны от оси ГК2, что позволяет с помощью графиков нагрузок оценить, какие заболевания характерны для тех и других групп пациентов. На положение точек слева относительно оси ГК2 почти во всех случаях влияют такие заболевания, как атопический дерматит и пиодермия, для средней и старшей группы - анормальная реакция на туберкулиновую пробу, а для младшей - неуточненная аллергия. Проведем анализ результатов по возрастным группам. Для младшей группы (1-3 года) характерно разделение не только на детей с ППЦНС и без него, но и разделение по возрасту.

Заметим, что на разделение точек вдоль первой главной компоненты, наиболее сильно влияют следующие заболевания: острый фарингит и бронхит, железодефицитная анемия, острый назофарингит, острый ларингит, менее сильное влияние оказывают диарея и гастроэнтерит (предположительно инфекционного происхождения), ветряная оспа, острый тонзиллит, грипп, функциональные кишечные нарушения, неинфекционные гастроэнтериты и колиты. При этом для годовалых детей характерны атопический дерматит, острый назофарингит, железодефицитная анемия, а для 3-летних - ОРВИ, острый тонзиллит, ларингит и бронхит, ветряная оспа.

В дошкольной группе (5-6 лет) сохраняется четкое различие между группами здоровых и больных пациентов. Острый фарингит и острый бронхит сохранили свое сильное влияние на разделение точек вдоль первой главной компоненты, но в то же время почти такое же влияние приобрел грипп, что может указывать на то, что для данной возрастной группы появление этого заболевания более характерно, чем для младшей возрастной группы. Отметим рост влияния таких заболеваний, как ветряная оспа и острый тонзиллит, а такие влиятельные заболевания для младшей возрастной группы,, как функциональные кишечные нарушения, конъюнктивит, диарея и гастроэнтерит (инфекционного происхождения) здесь практически не значимы. Возрастное различие сохраняется, но не четкое, как в младшей возрастной группе - вдоль ГК2 ряд точек практически перекрываются. Для 6-летних характерно влияние ветряной оспы, специфических расстройств речи и языка и гриппа, а для 4-летних более значимы острый ларингит, острый тонзиллит, пиодермия.

В группу младших школьников (7-11 лет) включены пациенты 5 возрастов; точки, соответствующие больным и здоровым детям, расположены на графике счетов не по разные стороны от ГК2, но четкое различие между ними сохраняется. Наибольшее влияние на расположение точек с индексом "b" (с ППЦНС) в этой группе имеет анормальная реакция на туберкулиновую пробу, которой не было в младшей группе. Отметим болезни желчевыводящих путей. На положение точек, соответствующих пациентам без ППЦНС, наибольшее влияние оказывают заболевания: острый бронхит, фарингит, тонзиллит, ларингит, ветряная оспа, энтеробиоз.

Заключение. Результаты исследований показали, что методы многомерного анализа, в частности МГК, могут с успехом применяться для анализа и поиска скрытых закономерностей в больших объемах медицинских данных. МГК был применен для оценки заболеваемости детей, имевших ППЦНС, и позволил выявить характерные отличия в заболеваемости по сравнению с контрольной группой. К недостаткам МГК относится невозможность разделения больных на группы по клиническим формам ППЦНС. Дальнейшая работа в этом направлении, в частности, построение по полученным данным моделей с применением методов многомерной регрессии позволит получить более качественные результаты.

 

Литература

 

1. Шарапова О.В. // Рос. вест. перинататол. и педиатрии.- 2004.- N 1.- с. 56-60.

2. Медик В.А. Заболеваемость населения: история, современное состояние и методология изучения.- М.: Медицина, 2003.- 509 с.

3. Hoskuldsson A. Prediction methods in Science and Technology // Basic Theory, Denmark.- 1996.- Vol. 1.

4. Классификация перинатальных поражений нервной системы у новорожденных // Методические рекомендации.- М.: ВУНМЦ МЗ РФ, 2000.- 40 с.

5. Фарбер Д.А. // Физиол. чел.- 2001.- Т.27, N 5.- с.8-16.

 

 

The Applications of Principal Component Analysis for Investigation of Morbidity of Children with Perinatal Lesions of the Central Nervous System

 

Z.F. Akinina, G.O. Kulikova, S.V. Kucheryavskiy,

A.I. Piyanzin, S.V. Suchanov, A.V. Fyodorov,

A.S. Shatokhin, A.I. Shcherbakov

 

Summary

The multivariate data analysis method - Principal Component Analysis has been applied to medical data consisted of frequencies of different diseases occurring in patients with perinatal lesions of the central nervous system in comparison.

Key words: principal component analysis, morbidity

 

 

 

 

 



* Алтайский госумедуниверситет, Е-mail: pijanzin@altai.info

*** Алтайская краевая клиническая детская больница г. Барнаул ул. Гущина 179

** Алтайский госуниверситет, E-mail: svk@asu.ru