Работа с медицинскими изображениями: КТ, рентген.

При диагностике заболеваний внутренних органов врачи используют компьютерную томографию или рентгенографию. Исследование медицинских изображений сложная и трудоемкая задача. К примеру, для компьютерной томографии необходимо за небольшой промежуток времени проанализировать большое количество снимков. В таком случае, возрастает риск человеческой ошибки при анализе диагностических результатов. 

В следующем примере мы рассмотрим как необходимо работать с медицинскими данными.

Первый шаг. Данные о пациенте.

При решении задач с медицинскими изображениями, приложенные датасеты не всегда могут иметь информацию о пациенте или могут быть представлены в небольшом объеме. В таком случае помогают метаданные о пациенте.


К примеру, на представленном датасете, хранится информация о локализации болезни, но данных о пациенте нет.

Обычно изображения, полученные с помощью медицинских оборудований, имеют специализированный формат. К примеру,  DICOM[1] - медицинский стандарт создания, хранения, передачи и визуализации цифровых медицинских изображений и документов обследованных пациентов. Далее мы будем говорить о нем.

На следующей картинке представлен фрагмент метаданных об одном из пациентов.

По представленному фрагменту можно заметить, что пол данного пациента не определен. Данные о пациенте вводит врач при обследовании. Есть и другие данные о пациенте, например, дата и время рождения, этническая группа, предрасположенность к болезням. Также часть из них генерируются автоматически, в зависимости от настроек оборудования. К примеру, степень сжатия, физическая дистанция между пикселями, наименование оборудования.

Шаг второй. Исследование изображения.

Рассмотрим скан одного пациента. Каждый метод диагностики имеет свои особенности. К примеру, компьютерная томография содержит порядка 100 - 1000 изображений на одного пациента в один промежуток времени, в то время как рентген содержит только один снимок. 

Пример скана КТ. 

Пример рентгеновского снимка.


Изображение можно получить из атрибута PixelData. Этот атрибут хранит информацию о двумерном изображении с одним каналом. Значения данного канала могут выходить за пределы привычных 0 - 255. Каждый пиксель хранит в себе значение единицы Хаунсфилда[2] - коэффициент поглощения рентгеновских лучей. Коэффициент для дистиллированной воды принято считать равным 0. На следующей картинке можно рассмотреть значения данной единицы для органов человеческого организма.

Но чтобы достать данную единицу необходимо линейно масштабировать значение пикселя. Это нужно для того, чтобы нормализовать настройки оборудования.

Ниже представлено уравнение преобразования.

Каждое значение берется из метаданных, где RescaleSlope - коэффициент наклона, а RescaleIntercept смещение.

Благодаря данному коэффициенту, мы можем определить к какому органу относится конкретный пиксель. На снимке КТ, светлые области принадлежат органам или костям большей плотности, в то время как воздух и легкие в основном являются практически черными.

При исследовании легких необходимо быть аккуратными и не учитывать область воздуха, ведь она имеет практически такую же плотность, что и легкие.

Шаг 3. Обработка изображения.

Для работы с КТ необходимо их упорядочить, чтобы воссоздать трехмерную структуру легких. Такие данные можно получить из метаданных InstanceNumber. Также между срезами в зависимости от сканера, могут быть разные расстояния, которые нужно учесть для однородности данных.

Далее высчитывается маска для конкретного органа, с помощью которой удаляются из области видимости лишние органы, не имеющие связи к болезни. Подсчет маски сама по себе сложная задача. Пример подсчета маски можно прочитать в работе из источника[3].



При наложении маски на исходное изображение можно выделить органы, которые важны при исследовании болезни. Затем по выделенным органам можно извлечь необходимые признаки, которые помогут при решении задачи.

Заключение

В заключении можно сказать, что работа с медицинскими данными довольно сложная и трудоемкая задача, но очень полезная. 

По работе с данными есть несколько выводов:

При использовании снимков различных медицинских оборудований, предварительно нужно нормализовать изображения и привести к однородному виду.

Если датасет не имеет информации о пациенте, ее можно выделить из метаданных о пациенте.

 Источники

1. Электронный ресурс стандарта DICOM. – URL: https://www.dicomstandard.org/about-home
2. Единицы Хаунсфилда. - URL: https://en.wikipedia.org/wiki/Hounsfield_scale
3. Выделение маски и анализ признаков. Monica Ramakrishnan, Surya Rajasekaran, Barsa Nayak, Akshay Bhagdikar Automated lung cancer nodule detection. – Santa Clara University, 2017