GitHub - boostcampaitech4cv3/level1_imageclassification_cv-level1-cv-20: level1_imageclassification_cv-level1-cv-20 created by GitHub Classroom
팀 회고
[Level1]Wrap-Up 리포트.pdf
팀원 평가
[Level1]이영섭T4154_20221111.pdf
개인 회고
이런 competition 종류의 AI 프로젝트는 처음 이었기 때문에 데이터를 분석하고 baseline 코드를 내가 원하는 대로 변형하는 것에 어려움을 느꼈다. 그래서 이번 프로젝트에는 아래의 목표들을 가지고 프로젝트에 참여하였다.
- EDA를 진행하며 데이터 분석하는 방법 배우기
- baseline을 통해 프로젝트 코드를 작성하는법을 학습하고 내 것으로 만들기
- data 전처리를 통한 학습에 알맞은 데이터셋 만들기
- 지금까지 학습한 내용으로 모델 성능 개선해보기
아래는 위의 목표를 이루기 위해 진행한 내용이다.
-
EDA
- info와 describe 같은 함수를 사용하여 데이터를 살펴보고 class를 분류하는 세 가지 중 age, gender는 csv를 통해 확인할 수 있지만 mask는 이미지 파일의 이름을 보고 확인할 수 있다는 것을 알 수 있었음
- age와 gender를 그룹으로 묶어 나머지 하나에 대한 시각화를 진행함
- 7장의 사진을 활용하여 RGB 값들의 차이를 시각화 하였으나 마스크의 색, 크기, 배경 등에 따라 값의 변화가 커 의미있게 사용하지는 못함
- 팀원들과 모두 각자의 EDA를 진행하였고 서로 공유하고 피드백하는 시간을 가짐
- https://www.kaggle.com/code/subinium/kakr-eda를 참조하며 EDA를 진행함
- 가독성을 생각하며 작성
-
baseline
- dataset.py와 model.py를 해석하여 train.py에서 활용하였음
- model.py와 loss.py에서 새로운 클래스를 선언하여 활용함
- dataset의 __getitem__의 사용법을 제대로 숙지하지 못하여 원하는 class 결과물을 얻어내는데 고생하였음
- 프로젝트가 진행되면서 def train 안에 새로운 기능들을 추가하여 사용함