Классификация белых кровяных телец при помощи нейросети

13.11.2023

Белые кровяные тельца (лейкоциты) в иммунной системе человека защищают от инфекции. Они состоят из нейтрофилов, эозинофилов, базофилов, моноцитов и лимфоцитов, причем каждый из них составляет определенный процент и выполняет определенные функции. Традиционно клиническая лабораторная процедура количественного определения конкретных типов лейкоцитов является неотъемлемой частью общего анализа крови, который помогает контролировать состояние здоровья людей.

Благодаря достижениям в области глубокого обучения изображения кровяного состава могут быть классифицированы за меньшее время и с высокой точностью при помощи различных алгоритмов. В 2022 учеными из США Thinam Tamang, Sushish Baral и May Phu Paing было проведено сравнительное исследование производительности различных архитектур сверточных нейронных сетей (CNN).

Какая из архитектур справилась с анализом лучше всего, и за счет чего ее использование стало возможным?

Сверточные нейронные сети считаются одной из передовых моделей для различных задач в сфере компьютерного зрения, в том числе для медицинских целей. По сравнению с другими сетями CNN, продемонстрировали более высокие достижения (по данным исследования российских ученых 2014-2020 годов).

CNNs обладают специфической чертой - инвариантностью, которая позволяет им видеть изображения, начиная от конкретных особенностей и заканчивая абстрактными характеристиками, так что, например, изображение с разбросанными чертами лица рассматривается CNN как личность. Свертка - это процедура извлечения признаков, которая использует ядро определенного размера. Ядро перемещается по всей сети с определенными шагами, которые задаются во время реализации архитектуры, в результате формируется карта объектов.

После ее извлечения используется процедура объединения, чтобы уменьшить размер карты. В конце концов изображение окончательно выравнивается, и формируется полностью или частично связанный слой сверточной сети. Затем изображение классифицируется с использованием слоя, который определяет вероятность попадания изображения в одну из нескольких категорий.

Для работы с изображениями состава крови были взяты на «переобучение» методом Transfer learning (передача процесса обучения с одного набора данных на другой – в описываемом кейсе, на данные о кровяных тельцах) 10 архитектур CNN: AlexNet, DenseNet 121, DenseNet 161, ResNet 18, ResNet 34, ResNet 50, SqueezeNet 10, SqueezeNet 11, VGG Net 11, VGG Net 13.

На основе поддающихся обучению параметров, среднего затраченного времени и точности были сопоставлены друг с другом наилучшие результаты, полученные после внедрения обсуждаемых моделей. По сравнению с другими архитектурами, DenseNet-161 лучше других справляется с задачей распознавания лейкоцитов, обеспечивая значительно более высокую точность (1.0) (1.0) при обработке 28,744,896 обучаемых параметров при временных затратах 4:24 минуты.