정현정 | Software Engineer

Untitled

Email | hjngy0511@gmail.com
Phone | 010-9054-8950
GitHub | https://github.com/Gracechung-sw
Blog | https://libertegrace.tistory.com/

의료 인공지능 회사인 DeepBio에서 Machine Learning(이하 ML) 기반 범용 인공지능 진단 플랫폼 소프트웨어의 Backend Application과 Machine Learning 모델 배포 및 서빙 등의 설계 및 개발, 운영을 담당하고 있습니다.
확장 가능하고 유연한 ML 분석 솔루션을 비즈니스 로직에 통합하기 위해 백엔드 팀 리더로서 ML연구팀 & 프론트엔드 팀 & 디자인/기획팀 등 여러 부서와 협업하며 ML 프로젝트의 기획부터 개발, 서비스화, 운영의 효율성을 엔지니어링으로 높이고자 했습니다.
Docker 컨테이너 기반 백엔드 마이크로 서비스의 규모 확장성을 고려하여 클라우드 아키텍쳐 설계를 하고 CI/CD 파이프라인 구축 경험이 있으며 운영시 발생하는 실시간 장애에 대응하고 있습니다.
제가 추구하는 동료로서의 가치는 '함께 일하고 싶은 사람'입니다. 개발 업무뿐만 아니라 Agile 개발 프로세스 도입, 사내 개발자 세션 발표, 컬쳐데이 기획, 문서화 등 팀 문화 성장을 위한 다양한 일에 참여하고 있습니다.

기술 스택

Python, Node.js (Typescript), Flask, Express, PostgreSQL, RabbitMQ
Docker, AWS (ECS, SageMaker, SQS, EC2, S3, RDS, CloudFront, Route53, ELB, CodeDeploy, CloudWatch, Lambda), GitHub Actions

경력

DeepBio 2021.03 ~ 현재

백엔드 엔지니어, 백엔드 팀 리더

여러 타입, 버전의 모델 서빙을 위한 ML 서빙 서버 구조 설계 참여 및 개발
- 문제점: 기존 서빙 서버는 단일 모델에 맞춰 개발되어 있어, 새로운 모델 타입과 버전이 추가될 때마다 서버를 새로 개발하고 배포해야 했음. 이로 인해 높은 개발 및 유지보수 비용이 발생함.
- 해결 방안: 모델 로딩 및 추론 파트와 추론 요청/응답 파트를 분리하여 서빙 서버를 재설계. 일관된 인터페이스를 정의하여 새로운 모델 추가 시 서빙 서버를 새로 개발할 필요 없어짐.
- 성과:
  - 1개의 모델만 서빙하던 서비스를 N개의 모델 서빙이 가능한 플랫폼 서비스로 재설계 및 개발 완료.
  - ML 연구팀과 개발팀 간 커뮤니케이션 리드.
  - Mock ML 모델 개발을 통해 개발팀과 연구팀 간의 일정 의존성 최소화, GPU 서버 사용 시간과 비용 절감. 비용 절감 약 674.36 USD (838,856.63 원) / 1개월.
  - ML 모델 개발 프로세스 및 버전 관리 정책 정립.
  - ML 모델 테스트 환경 구축.
백엔드 마이크로 서비스 설계 및 개발
- 문제점: DeepBio는 진단 서비스로 Open API와 WebApp 두 가지 제품을 운영하고 있으나, 이 두 서비스의 백엔드와 ML 서빙 서버가 각각 별도로 개발되어 신규 개발 및 유지보수 비용이 2배로 증가함.
- 해결 방안: Open API와 WebApp 제품이 동일한 백엔드 마이크로 서비스와 ML 서빙 서버를 공유하도록 API 서버를 비롯한 모든 백엔드 서비스를 전면적으로 개선.
- 성과:
  - 암 진단 플랫폼 신규 프로젝트의 기획부터 개발, 운영에 백엔드 리드로서 참여.
  - Open API와 WebApp 제품의 API 재개발.
  - Express & Jest, Python & Unittest를 사용한 테스트 코드 작성 및 리팩터링으로 개발 품질 향상.
  - 병리 이미지 요청 처리 성능 향상을 위한 Pre-Processor 설계 및 개발. 기존 4.6~5.5초 걸리던 렌더링 속도를 약 3초 단축하여 1.367초로 개선.
백엔드 및 서빙 서버 모니터링 및 장애 대응
- ML 모델 성능 모니터링 및 개선사항 제안 (관련 링크)
  - 추론 지연 프로파일링 및 Numpy를 활용한 행렬과 벡터 연산 최적화. 추론 소요 시간을 약 86% ~ 97% 감소.
  - GPU 리소스 비용 최적화 및 ML 추론 응답 지연 최소화를 위한 ML 모델 서빙 서버의 Scale-in/out application 설계 및 개발.
- 서비스 장애 발생 시 디버깅 및 해결, 포스트모템 진행 (관련 링크)
  - AI 분석 실패 알림을 위한 Dead-Letter Queue 및 AWS Lambda 도입. 불필요한 GPU 리소스 낭비 제거.
  - AWS SQS의 ChangeMessageVisibility API 도입 (관련 링크) visibility timeout으로 인한 장애 해결.
DevOps팀이 별도로 없는 환경에서 서비스 배포 및 운영 환경 구축
- 컨테이너 기반 백엔드 마이크로 서비스 AWS 아키텍처 설계.
- Docker, GitHub Actions, AWS CodeDeploy를 활용한 CI/CD 파이프라인 구축 및 운영. (관련 링크)
- Slack 메신저 앱을 활용한 실시간 서버 장애 알람 기능 개발.
백엔드 팀 리드
- 백엔드 팀 Scrum planning 및 주간 미팅 리드.
- 사용성, 임상 실험 결과에 따른 백엔드 개발 방향성 제시 및 일정 조율.
- 개발팀 애자일 프로세스와 Monorepo 도입. (관련 링크)
- 사내 스터디 리드 및 약 8건의 개발자 세션 발표. (관련 링크)

커뮤니티

활동

리팩터링 스터디 2022.06 ~ 2022.11

마틴 파울러의 <리팩터링 2판>을 토대로한 사내 스터디 개설 및 진행
- https://github.com/Gracechung-sw/refactoring-2nd-edition

Mash-Up 2022.04 ~ 2022.06

IT 동아리 Mash up 12기 Node team crew
- NestJS 스터디 참여
- 프로젝트 진행 및 해커톤 참여를 통해 안드로이드 애플리케이션 백엔드 개발 완료
- https://github.com/mash-up-kr

글또 2022.05 ~ 2022.10, 2021.07 ~ 2022.01

글 쓰는 개발자 모임 활동
- 6, 7기 기간 동안 약 59개의 글 작성 및 블로그 업로드

학력

이화여자대학교 2015.03 ~ 2021.02

뇌.인지과학 심화전공 / 컴퓨터공학 부전공

2020.09 - 2021.03 이화여자대학원 Medical Imaging & Signal Lab
- 학부 연구생으로 medical image의 landmark detection 프로젝트 진행

기타

딥바이오 블로그 글

발표

Model 개발 및 운영 전략