Как работает компьютерное зрение в медицине: разбираем на примере

13.11.2023

Ультразвуковое исследование является основным методом диагностики рака молочных желез, и скорость этой диагностики, вместе с точностью, напрямую влияет на процент выздоровления и смертности. Анализ снимков УЗИ относится к наиболее сложным задачам, поэтому в настоящее время к биомедицинским изображениям применяются особые методы машинного обучения для достижения высоких показателей классификации – такие, которые заменили бы человека и могли «посмотреть» на медицинские снимки взглядом опытного врача.

В сфере здравоохранения для воплощения этой идеи, к примеру, пользуются высокотехнологичными камерами и датчиками для визуализации и извлечения информации. Но это лишь малая часть технологии компьютерного зрения. Более полно спектр её возможностей можно оценить по методу генерации глубоких признаков на основе сетки (greed-based deep feature generation-based image classification model).

Данными своего исследования, показавшего успешную модель диагностики УЗИ-снимков, поделилась группа ученых, работающих с клиниками Китая, Турции и Саудовской Аравии.

Как выглядит работа эффективной модели?

В основе фреймворка были задействованы 16 предварительно обученных моделей в качестве генераторов признаков. На первом этапе используемое входное изображение делится на строки и столбцы, и генераторы применяются к каждой строке и столбцу. Модель может вычислять значение ошибки каждого генератора глубоких признаков, затем она выбирает три лучших вектора признаков и считает их финальными.

На этапе выбора объектов итеративный анализ соседствующих компонентов (INCA - iterative neighborhood component analysis) выбирает оптимальные 980 объектов. Наконец, эти признаки классифицируются с помощью глубокой нейронной сети (DNN - deep neural network).

Ученые пришли к выводу, что разработанная модель классификации изображений на основе сетки достигла точности определения ультразвуковых снимков 97,18% для трех классов изменений в тканях молочных желез, а именно злокачественных, доброкачественных и нормальных. Такая точность метода наделяет его потенциалом для извлечения из медицинских изображений информации, которая может быть не видна человеческому глазу.

Закономерно, что подобные результаты поддерживают тренд на расширение инвестиций в развитие технологий компьютерного зрения. По прогнозам Facts and Factors market research report, объем рынка вырастет до 2,4 миллиарда долларов к 2026 году.