УДК 681.142.6:621.397
ИСПОЛЬЗОВАНИЕ СИСТЕМЫ ТЕХНИЧЕСКОГО ЗРЕНИЯ ДЛЯ ОПРЕДЕЛЕНИЯ ФОРМУЛЫ КРОВИ
К. В. Новиков*
Цитоморфологический анализ крови - один из важнейших и широко применяемых методов диагностики различных заболеваний. В настоящее время используется два основных метода проведения этого анализа. Первый заключается в визуальном изучении препарата врачом-лаборантом с помощью микроскопа. Второй - в применении специализированных проточных счетчиков клеток крови, действие которых основано на пропускании крови через тонкие капилляры с внутренним диаметром, близким к размерам клетки, и регистрации клеток, проходящих через капилляр, с помощью оптических или электрических датчиков. Проточные счетчики не позволяют обнаружить такие морфологические особенности клеток, которые может увидеть врач-лаборант. С другой стороны, анализ вручную с помощью оптического микроскопа очень трудоемок. Поэтому существует потребность в автоматизации цитоморфологических анализов путем применения системы технического зрения. На первом этапе для автоматизации была выбрана задача подсчета лейкоцитарной формулы крови.
Для определения лейкоцитарной формулы крови система должна распознавать виды клеток, представленные на рис. 1 [3]. В каждом классе клеток наблюдается некоторый полиморфизм, но, тем не менее, клетки одного вида объединяет ряд характерных только для них признаков. Прежде чем приступить к выделению этих признаков, необходимо выделить на изображении такие структурные элементы клеток, как ядра и цитоплазмы.
Рис. 1. Виды лейкоцитов: а - палочкоядерные нейтрофилы;
б - сегментоядерные нейтрофилы; в - палочкоядерные базофилы; г - сегментоядерные базофилы; д - палочкоядерные эозинофилы; е - сегментоядерные эозинофилы; ж - моноциты; з - лимфоциты
Предварительные исследования изображений, поступающих на вход системы, показали, что изображение может быть сегментировано по цветовым признакам. Эксперименты проводились с помощью специально разработанного программного модуля, позволяющего выделять в цветовом пространстве HSV области, ограниченные плоскостями, перпендикулярными осям цветовых координат. Пикселы изображения, цвет которых не входит в выделенную область, окрашиваются в черный цвет. Изменяя границы области удалось выделить множества цветов, соответствующих фону, ядрам лейкоцитов, цитоплазме лейкоцитов и эритроцитов. На рис. 2 приведены гистограммы всего изображения, а на рис. 3 - гистограммы ядра лейкоцита.
Рис. 2. Гистограммы изображения и исходное изображение
Рис. 3. Гистограммы выделенной области и выделенная область
Задача сегментации осложняется тем, что наблюдается некоторая неоднородность освещения, которая снижает точность сегментации. Для нормализации изображения используется преобразование по формулам:
PR(x,y)= PR'(x,y)/F'R(x,y)*I ;
PG(x,y)= PG'(x,y)/F'G(x,y)*I ;
PB(x,y)= PB'(x,y)/F'B(x,y)*I,
где P'R , P'G , P'B - цветовые каналы неоднородно освещенного изображения; F'R , F'G , F'B - цветовые каналы неоднородного фона (снимок чистого предметного стекла); I - константа.
Нормализация изображения приводит его к стандартным условиям, что снижает дисперсию цветовых признаков внутри каждого класса объектов и тем самым повышает точность сегментации [1].
Сегментация изображения является вероятностной задачей классификации пикселов изображения. Пикселы могут быть отнесены к фону, цитоплазмам или ядрам лейкоцитов. В качестве вероятностного признака выступает цвет пиксела (точка цветового пространства). Для классификации был использован критерий Байеса, обеспечивающий минимум среднего риска от распознавания [1]. Риск вычисляется по формуле
,
где сki - проигрыш от отнесения объекта, принадлежащего классу W k, к классу W i (экспертная оценка), P(W i) - априорная вероятность появления объектов, относящихся к классу W i, fi(x) - условная плотность распределения вероятностей значений признаков для класса W i.
Для определения условной плотности вероятностей был применен метод обобщенной гистограммы с круговой функцией ядра [1]. Оценка функции условной плотности вероятностей рассчитывается по формуле
,
где K - функция, называемая ядром; h - коэффициент "размытости", являющейся функцией от N; m - мерность пространства признаков, (x-xi) - расстояние от x до xi, взятое в соответствии с выбранной мерой.
На сегментированном изображении можно выделить признаки лейкоцитов, необходимые для их распознавания. Одним из важнейших признаков лейкоцита является вид ядра. Необходимо различать сегментированные, палочкообразные ядра, ядра лимфоцитов и моноцитов [2, 3]. Для распознавания ядра используются признаки, получаемые при анализе его контура и скелета (рис. 4) [4]. Ядро описывается площадью, длиной скелета и двумя величинами, вычисляемыми по формулам:
;
,
где ,
- евклидово расстояние между пикселами psi и pcj, psi - пиксел скелета с номером i, pcj - пиксел контура с номером j. Каждый из этих признаков имеет характерные значения для определенного вида ядер. Например, минимальная толщина ядра принимает самые маленькие значения для сегментированных ядер. У палочкообразных ядер она примерно равна максимальной толщине и т. д.
Рис. 4. Контур и скелет ядра лейкоцита
Задача классификации ядер решается как детерминированная задача распознавания. Объект относится к тому классу, расстояние до которого наименьшее [1]. Если задано множество объектов Ri, относящихся к классу W i, то расстояние от распознаваемого объекта w до класса можно определить следующим образом
,
где - эталонный объект относящийся к классу W
i, D - функция расстояния (метрика). Для измерения расстояния между ядрами в выбранном признаковом пространстве использовалась метрика Камберра
,
где n - количество признаков, x1, ..., xn - признаки распознаваемого объекта w
, - признаки эталонного объекта rij. От других она отличается тем свойством, что влияние признаков с различными диапазонами изменения на расстояние между объектами уравнивается [5].
Распознавание вида цитоплазмы необходимо для дифференциации гранулоцитов [2,3]. Система должна распознавать нейтрофильную, эозинофильную и базофильную цитоплазмы. Исследования показали, что в качестве признака может быть использован средний цвет пикселов цитоплазмы. Определение этого показателя осложняется тем, что в мазках крови цитоплазмы лейкоцитов часто касаются эритроцитов. Поэтому прежде нужно провести их разделение. Учитывая, что ширина цитоплазмы гранулоцитов примерно одинакова [2, 3], можно считать пикселами цитоплазмы только те, расстояние до которых от контура ядра не превышает некоторой фиксированной величины. Для классификации цитоплазм по среднему цвету принадлежащих им пикселов применен тот же метод, что и для ядер, но использовалась евклидова метрика.
После распознавания вида ядра и цитоплазмы клетка может быть описана логическими признаками. Задача классификации клеток крови сводится к логической задаче распознавания в ее простейшем виде [1].
На основе полученных методов в лаборатории был построен прототип системы определения лейкоцитарной формулы крови. Результаты испытания показали эффективность выбранного подхода.
Полученное решение задачи распознавания лейкоцитов не обязательно является оптимальным. В дальнейшем предполагается повышать точность, надежность, производительность системы, увеличивать количество классов распознаваемых объектов, что позволит решать более широкий круг задач цитоморфологического анализа крови. Те же методы скорее всего могут быть успешно применены к анализу изображений других микробиологических препаратов, что избавит врачей-лаборантов от рутинной работы и расширит возможности лабораторий.
Литература
The application of technical vision system for morphological blood analysis
К.V. Novikov
Summary
The frequent usage of the morphological blood analysis in clinical practice and its high labour-intensiveness causes the need of an automated system development. Some properties of a blood cell may be detected only by using a technical vision system. The article describes the set of image processing and interpretation methods, which may be used in the technical vision system for determining the leucocyte formula on dry blood smear.
Новиков Константин Владимирович в 1998 году окончил Владимирский государственный университет по специальности "Вычислительные машины, комплексы, системы и сети". Прошел специализацию по направлениям "Информационные системы" и "Обработка и распознавание изображений". После защиты дипломной работы на тему "Исследование методов распознавания клеток крови по их изображениям" поступил в аспирантуру.