부스트캠프 수료 후 취준을 거하게 말아먹은 후 11월부터 다시 공부 중이었는데 sns에 개발 컨퍼런스 광고가 다양하게 올라오길래 어쩝히 시간은 남아도니 한 번쯤 참여해보기 좋은 기회다 싶어 참여했다.
개최정보
이번 행사는 삼성전자 서초사옥 5층에서 11/14 ~ 11/15까지 이틀에 걸쳐 진행되었다. 예상보다 사람이 많아서 공간은 붐볐다.
대게 이런 행사는 메인세션이되는 발표 외에도 추가적으로 기술을 직접 보여주며 홍보하는 전시칸이 있고 이런 부스를 보는걸 좋아하는데(기념품을 받는다거나...) 부스는 할당된 공간도 적고 홍보, 체험보다는 기술 소개에 중점을 둔 것 같았다.
커리어 컨설팅 공간도 있었는데 당시에는 어떤 질문을 할지 딱히 떠오르지 않아 신청하지 않았다. 직접 보니 공개된 공간이 아니라 별실에서 진행되고 있었기에 부담을 느낄 필요는 없었을것 같긴 하다.
Session: 의료 분야의 데이터와 AI 기술 적용 : 데이터 파이프라인과 AI 모델
아주대학교의료원의 임준혁 연구원님의 발표였으며 의료 서비스를 개발하는 과정에서 실행한 다양한 연구와 그에 대한 이유 그리고 시행착오들에 대해 말해주셨다. 모델이나 방법론 설명이 아닌 데이터와 파이프라인 이후 모델과 서비스까지 전반적인 내용을 다룬 개발 후기 및 인사이트 공유에 가까웠다.
발표는 데이터 사이언스나 엔지니어링을 전업으로 하지 않는 개발자도 들을 수 있을만큼 눈높이를 잘 맞춰서 진행해 주었다. 가장 최근에 참여한 대회가 의료 Segmentation분야여서 그런 감도 있는 것 같긴 하다.
발표는 크게 3가지 분야로 나누어져 있었다.
- 데이터
데이터는 현재 주로 사용되는 비정형 의료 데이터의 포맷과 특성을 설명하고 이러한 특성들이 모델링에 어떤 영향을 미치는지 그리고 현업에서 수집되는 데이터를 서비스에 접목하기 까지 겪은 다양한 에러?들을 설명해주었다.
정형 데이터에 사용되는 EMR 데이터는 메인으로 삼지 않았던 것 같았고 주로 DICOM과 Whole sliding image(백색 배경에 보라색세포가 그려져 있고 resolution이 높은) 이미지를 메인으로 설명해 주었으며 의료분야 데이터의 큰 resolution 그리고 다양한 병원에서 수집되는 이미지들 간의 차이에 대해 알려주었다.
- 데이터 파이프라인
개인적으로 발표에서 가장 중요하고 연구시간, 노력이 가장 많이 든 부분이라고 생각된다.
전반적인 파이프라인은 위와 같았으며 DICOM데이터는 비정형이기에 다른 파일이 들어가 있거나 사진에 사인이 들어가 있는 등의 이상치를 검수해서 기존 DICOM에서 정제된 데이터를 뽑아 데이터셋을 생성하는 과정이다. 모든 과정을 상세히 이해하지는 못했지만 이후 모델의 선정과 최적화 역시 중요하지만 데이터셋 제작에 들인 노력이 비교도 안되게 커보였으며 이런 식의 체계화된 데이터 파이프라인 구성의 중요성을 다시 한번 깨달았다.
- 모델 및 서비스
모델면에서는 사실 큰 흥미를 느끼지는 못했다. 다양한 모델을 시험하고 최선의 것을 사용했다 했으며 실험들로 얻은 인사이트를 설명해 주었는데 모델이나 방법론을 모르는 부분은 아예 이해할 수 없고 아는 부분은 흥미가 떨어졌다. 그렇다고 실험 결과를 분석하며 설명하기엔 시간이 부족하니 당연한 결과인 듯싶었다.
후기
- 오후에 일정이 있어 원래는 일찍 가서 발표 2개를 들으려 했는데 백수생활에 너무 익숙해져 버린 나머지 하나밖에 못 들어서 아쉬웠다.
- 도메인별 특성의 중요성? 의료 도메인에 대한 발표만 들었음에도 다시 한번 와닿았다.
그리고 개발행사에서 빠질 수 없는 기념품!
레고, 스티커, 볼펜, 노트를 모두에게 나눠주었다. 사실상 이런 기념품이 개발행사의 꽃이 아닐까... 노트가 적당히 작은 사이즈라 공부할 때 쓸 것 같고 레고는 개발할 때 앞에 두면 심심함을 좀 덜 수 있다...?
모든 발표 영상과 자료는 이 사이트에서 확인할 수 있다.
'개발행사, 컨퍼런스' 카테고리의 다른 글
파이콘 한국 2024 후기 (2) | 2024.10.30 |
---|