Заказчик
ООО Виста
Контакты
Качаев Сергей
Куратор
И.С. Блеканов
В рамках данного проекта вам предстоит обучить нейросетевую модель семейства CNN для задачи детекции различных патологий на рентген-снимках. Набор данных вы можете взять с сайта kaggle, или с других открытых источников, вот пример некоторых из них: https://www.kaggle.com/datasets/vbookshelf/tbx11k-simplified, https://www.kaggle.com/datasets/tawsifurrahman/tuberculosis-tb-chest-xray-dataset, https://www.kaggle.com/datasets/pcbreviglieri/pneumonia-xray-images. В качестве основной модели вы можете использовать любые CNN-архитектуры, скорее всего вам подойдут семейства EfficientNet и DenseUnet. В процессе выполнения задания вы можете столкнуться с проблемами недостаточного обучения или, наоборот, сильного переобучения модели на ваших тренировочных данных. Вот несколько возможных решений, которые могут помочь вам: -Добавление новых данных в обучающую выборку. Попробуйте объединить в ней снимки из разных наборов данных. - Оценка тепловых карт предсказывающей модели. Так вы сможете понять, куда именно смотрит ваша модель в момент предсказания. - Дополнительные обработки изображения – отделение смазанных/шумных изображений, поиск контуров интересующих вас областей(например, самих лёгких), возможная их сегментация. В результате у вас должны получиться модель, которая будет, во-первых, с хорошей вероятностью классифицировать изображения по вами определённым классам (можно взять пневмонию/туберкулёз, а так же просто маркеры здоров/болен). И во-вторых, достаточно точно определять области на изображении, которые являются маркером данной болезни.
Уникальные проект Санкт-Петербургского государственного университета получения практических
навыков без отрыва от учебного процесса для решения задач, поставленных заказчиком.
© СПбГУ, 2023