Name Last commit Last update
README.md Update README.md

OSSP: medical classification project


Day 1~3

  • OSSP 주제선정

주제는 처음 주제는 알약을 분류하고 알약 사진에 대한 예측 값을 가져와서이에 따라 알약의 성분 및 정보를 알려주는 주제를 하려고 하였다. 하지만 이는 시간적으로 부족하기도 하고 이를 진행 했을 때 완성도와 성능도 떨어질 것이라 예측하여 주제를 바꾸게 되었다.

이번 프로젝트는 의료데이터를 사용하고 이를 통해 웹서비스를 배포하고 싶은 생각을 하며 주제를 정하게 되었다.

주제는 질병의 질환을 예측하는 서비스를 구성해보려고 한다.

  • 자료 수집

주제에 따른 내용에 대해 자세히 알아보기 위해 google, github, youtube, kaggle을 이용하여 자료를 수집하고 참고할만한 자료들을 수집했다.

  1. 당뇨병 예측 플라스크

당뇨병에 대해서 사람의 나이와 당도 등 몇몇 정보를 기입하면 이에 따라서 당뇨병에 대해서 예측을 하는 웹서비스 이다.

이는 csv로 파일을 받아와서 데이터베이스와 연동하여 실행이 되는 것이다.

  1. 질병 다중 예측

질병의 종류를 여러가지로 하여 하나하나 모델링을 하고 이를 분류하여 플라스크로 연동을 한다.

  1. Disease Prediction

당뇨병, 유방암, 심장질환, 신장, 간, 말라리아, 폐렴 총 7가지의 질병을 예측하는 분류기이다.

데이터 세트는 kaggle에서 다운받았고 이는 Flask web framework로 서비스를 이용할 수 있다.

  1. X-ray classification

X-Ray 사진을가지고 폐 의료 영상을 분류하는 것이다.

  1. 유방암 진단

유방암 진단 인공지능 서비스를 간단하게 만드는 유튜브이다. 이를 보고 진행하는 것도 나쁘지 않다고 생각이 들었다.

최종적으로 X-ray 사진을 가지고 의료 영상을 분류하는 서비스가 괜찮다고 생각하여 이를 가지고 DB를 찾아보았다.

소스코드

  1. X-ray data

kaggle에 있는 데이터로 test, validation data 약 5800장 정도가 있다.

  1. aihub 폐암 진단 데이터

aihub의 헬스케어에 있는 데이터 이다. 이를 이용하면 좋을 것 같지만 일단은 신청해 놓은 상태이다.


Day 4

-OSSP 주제선정 확정

질병 예측 웹 서비스 : 폐렴

병원에서는 의사의 눈으로 X-ray상에서 폐렴인지 아닌지 구분을 하게된다. 그 결과 간혹 폐렴 환자를 정상환자로 구분할 수가 있다. 이러한 오류를 막기위해 X-ray 사진을 학습시켜서 환자의 정확한 진단을 돕는 다는 취지의 웹 서비스를 구현하려고 한다.

  • 구성

dataset : crawling , Kaggle, github 활용 예정

Learning model : vgg-16(불확실) transfer - learning or finetuning

개발환경 : Colab(pro)

programing : pytorch, Flask, HTML, CSS


Day 5

  • Dataset : Kaggle ( Chest X-ray )

training data : 약 5000장 validation data : 약 600장

  • 개발 환경 : Colab(pro)

  • 학습설계

  1. 데이터 전처리

  2. 모델 학습 : vgg-16 이용

(tranfer learning and Finetuning)

  1. 모델 추출 :

  2. Flask web : Flask 사용 또는 Django 사용 예정