포트폴리오

실제로 배포된 작업들

무엇을 만들었고, 왜 중요했고, 어떤 아키텍처로 구현했는지 케이스 스터디 형태로 정리했습니다.

ML / Python개인 프로젝트 · 2024

대출 승인 예측 API

87k행의 대출 데이터셋을 입력받아 전처리(결측치, 인코딩, 스케일링)를 완료하고, 랜덤 포레스트 분류기를 학습시켜 FastAPI REST 엔드포인트로 예측을 제공합니다. 모든 예측은 SQLite에 감사 로그로 기록됩니다.

98%
모델 정확도
87k
학습 데이터 행
15
사용 피처 수
<50ms
API 응답 지연
아키텍처 / 데이터 흐름
CSV데이터셋87k행데이터전처리결측치 처리피처엔지니어링15개 특성랜덤포레스트100 트리FastAPI엔드포인트REST JSONSQLite로깅감사 로그98% 정확도
  • SMOTE 오버샘플링으로 클래스 불균형 처리 — 소수 클래스 재현율 61% → 89% 향상.
  • 피처 중요도 분석: 상위 예측자는 credit_history, loan_amount_term, applicant_income.
  • Pydantic 검증 및 JSON 응답 포함 FastAPI 엔드포인트 구현, SQLite 감사 로그 추가.
Pythonscikit-learnFastAPIPandasSQLitePydanticSMOTE
데이터 엔지니어링YD&S Co., Ltd. · 2024–현재 · 실서비스

지자체 데이터 플랫폼

한국 지방자치단체를 위한 대규모 데이터 인프라 — GIS 데이터, 인구 통계, 예산 DB, IoT 센서를 통합 PostgreSQL 웨어하우스로 수집합니다. 도시 계획 담당자와 공무원이 정책 의사결정에 활용하는 실시간 대시보드를 제공합니다.

4+
데이터 소스 유형
지자체
클라이언트 (공공 부문)
매일
ETL 실행 주기
실서비스
운영 중
아키텍처 / 데이터 흐름
데이터 소스GIS 데이터인구 통계예산 DB센서ETL 파이프라인추출→변환→적재데이터 웨어하우스PostgreSQLREST APIFastAPI / Next.js대시보드지자체 의사결정지자체 데이터 플랫폼 · YD&S Co., Ltd. · 실서비스
  • GIS 셰이프파일, CSV 인구조사, SQL 덤프 등 4가지 이종 소스에서 ETL 파이프라인 설계.
  • 웨어하우스 적재 전 중복 제거, 결측치 전략, 데이터 품질 검증 게이트 구현.
  • 웨어하우스 위에 REST API를 구축해 Next.js 프론트엔드 대시보드에 데이터 제공.
  • Prisma 마이그레이션으로 스키마 버전 관리 — 변화하는 정부 데이터 요건 대응.
PythonPostgreSQLPrismaNext.jsFastAPIETLGISSQL
PUB
연구 기여

계산신경과학 — UofT (2023)

NatureAutonomic Neuroscience에 게재된 바이오메디컬 연구에 데이터 분석 및 자동화 파이프라인을 기여했습니다. 신호처리, 통계 검정, 그림 생성을 위한 Python 스크립트 개발.

PythonNumPySciPyMatplotlib신호처리

협업에 관심 있으신가요?

개발 직무, 프리랜서 프로젝트, 기술 협업 모두 환영합니다.