3 minute read

📠 5 & 6 & 7주차 회고록

벌써 Image Classification P Stage가 끝났다.
대회는 마스크 이미지가 주어지면 성별(2, Male, Female), 연령(3, <30, >=30 and <60, >60), 마스크 유무(3, 제대로착용, 미착용, 오착용)으로 클래스를 나누어 2x3x3 총 18개의 클래스로 분류해야 하는 문제였다.
이미지 데이터를 수집할 필요 없이 대회에서 주어지는 이미지를 사용했는데, EDA과정에서 데이터의 잘못된 라벨링, 연령과 성별의 불균형등 문제가 있는 것을 파악했다.
대회 초반에는 BaseLineCode와 몇가지 모델을 써가며 어떤 것이 좋은지를 다양한 실험을 해보았는데, 혼자서 좋은 성적을 내려면 엄청난 시간이 걸리는 것을 알게되었다.
우리팀은 개인의 Task를 나누어 대회의 능률을 높히려고 하였는데 그 중에서 나는 데이터의 불균형과 잘못된 라벨링을 잡기위해 마스크를 쓰지않은 이미지를 기존 훈련된 모델을 사용해 Age, Gender를 다시 라벨링하여 조금 일반화 하자는 전략을 팀원들께 말씀드렸고 내가 맡게됬다. 모델을 찾는 것부터 적용하고, 다시 전처리 하는 과정이 꽤 오래 걸렸다.(시간을 너무 뺐겼다. 두번의 실패)
coral-cnn과 FaceFair모델을 사용하게 되었는데 coral-cnn은 분류를 너무 못하고, FaceFair모델은 어느정도 오차범위 내에서는 예측하는 것 같아 이것을 사용하여 라벨을 다시 정하고 AB테스트를 위해서 다른 동일한 조건에서 수행하였지만 결과는 기존 데이터를 사용한 것 보다는 좋았지만 age의 범위를 60세가 아닌 59세를 나눴을때가 더 좋았다. (너무 일반화를 하였는가 아닌 생각이 든다.)
또한 막바지에 Cutmix라는 기법도 사용해 보았는데, 성능이 오히려 떨어져 사용을 하지 않았다.
내가 대회 성적 향상에 도움 준 것은 아무것도 없다는 생각이 들어 팀원들에게 되게 미안하다…
하지만 나의 실험을 기대해준 팀원들에게 너무 고맙다. 다음엔 조금 더 전략적으로 문제를 파악하는데 시간을 좀 더 투자할 것이다.

📞 강의 복습 내용

5주차 AI 서비스 개발 기초 강의와 AI 현업자 특강을 들을 당시에는 도커, 쉘 커맨드 따라하기, CI/CD 따라해보기등 시간이 많이 남아서 다양한 실습을 혼자 해보며 학습정리도 제때제때 하였다. 하지만 P Stage가 시작되고, 강의를 첫날에 다 듣고 Special Mission을 보고 따라해보는 것 까지는 괜찮았으나, BaseLineCode가 주어지고 예시코드가 주어지면서 대회에 집중하게 되었고, 성능을 어떻게 하면 높힐까에 대한 고민을 했던 것 같다.(결론 강의 복습 못했음)

⏰ 얻게 된 것

  • 이런 대회는 인생에서 처음이고 Deep Learning Work Flow를 직접 경험 할 수 있었다.
  • 이미지 분류 AI의 성능 개선에 필요한 요소를 대략적으로 알 수 있게 되었다.
  • 마지막으로 가장 좋았던 것은 프로젝트 협업 툴을 다양하게 많이 사용하여 서로서로 공유를 빠르고, 정확하게 할 수 잇는 방법들을 얻게 되었고, 협업의 중요성을 또또또 알게 되었다.

우리팀들 너무 고생많이했고 고맙다.

Comments