업무 경력
프로젝트 참여 이력
글로벌 멀티리전 서비스 구축 및 운영
DevOps Engineer2023.05 - 2026
AWS 기반 글로벌 멀티리전 서비스의 멀티 환경 인프라 구축, GitOps 배포 자동화, Observability 체계 수립
글로벌 멀티리전 서비스 구축 및 운영
DevOps Engineer2023.05 - 2026
AWS 기반 글로벌 멀티리전 서비스의 멀티 환경 인프라 구축, GitOps 배포 자동화, Observability 체계 수립
담당 업무
- Multi-Region Account(DEV/STG/PRD/NTW) 구성 및 TGW Hub 기반 중앙 집중형 네트워크 관리
- WAF, GuardDuty, Network Firewall을 통한 보안 체계 구축
- GitLab(EC2) + GitLab Runner(Fargate) 기반 CI/CD 인프라 구축
- EKS + Helm + ArgoCD를 통한 Application 배포 파이프라인(batch/backend/frontend) 구축
- ETL 파이프라인 구축 (Glue, S3, StepFunction, Airflow)
- AWS Batch on EKS를 통한 Job 배포 파이프라인 구축
- Cloudwatch Application Signals 기반 SLO/SLI 모니터링 및 알람 구축
- Fluentbit 로그 수집 및 Lua Script 기반 Metrics 추출 파이프라인 구축
- FinOps 비용 절감 활동 (RI, SP, Spot Instance, 주간 비용 모니터링)
기술 스택
주요 성과
- ✓ GitOps 도입으로 배포 프로세스 표준화 및 개발팀 배포 효율 개선
- ✓ TGW Hub 구성으로 Multi-Account 네트워크를 중앙 집중 관리
- ✓ SLO/SLI 기반 알람 시스템으로 장애 탐지 시간 단축
- ✓ Fluentbit Lua Script로 Application 로그에서 비즈니스 Metrics 자동 추출
- ✓ FinOps 활동으로 월간 클라우드 비용 절감
GitOps 기반 EKS 운영 및 배포 자동화
DevOps Engineer2024.01 - 2025
Terraform, Helm, ArgoCD를 활용한 멀티 환경 EKS 클러스터 운영 및 CI/CD 파이프라인 구축
GitOps 기반 EKS 운영 및 배포 자동화
DevOps Engineer2024.01 - 2025
Terraform, Helm, ArgoCD를 활용한 멀티 환경 EKS 클러스터 운영 및 CI/CD 파이프라인 구축
담당 업무
- Terraform 기반 EKS 클러스터(dev/stg/prd) 프로비저닝 및 IaC 관리
- Helm Chart + ArgoCD를 통한 GitOps 배포 자동화 구축
- GitLab CI 연동으로 Docker 이미지 빌드 → ECR 푸시 → values.yaml 자동 업데이트 파이프라인 설계
- External Secrets Operator + AWS Secrets Manager 기반 시크릿 관리 체계 구축
- Feature 브랜치 기반 Preview 환경 자동 생성/삭제 구현
기술 스택
주요 성과
- ✓ GitOps 도입으로 배포 프로세스 표준화 및 개발팀 배포 효율 개선
- ✓ PR 기반 변경 리뷰 체계로 인프라 변경 추적성 및 감사 로그 확보
- ✓ 신규 서비스 온보딩 자동화로 환경 구성 시간 단축
- ✓ ApplicationSet + Git Generator 도입으로 앱 증가에 따른 관리 효율 향상
Kubernetes 네트워크 트러블슈팅 및 안정성 개선
DevOps Engineer2023.06 - 2024.03
EKS 환경에서 CoreDNS, CNI, 리소스 최적화를 통한 클러스터 안정성 확보
Kubernetes 네트워크 트러블슈팅 및 안정성 개선
DevOps Engineer2023.06 - 2024.03
EKS 환경에서 CoreDNS, CNI, 리소스 최적화를 통한 클러스터 안정성 확보
담당 업무
- EKS CNI Secondary IP 기반 네트워크 이슈 분석 및 해결
- CoreDNS 리소스 부족으로 인한 DNS SERVFAIL 장애 원인 분석 및 대응
- CoreDNS HPA 정책 설계 및 자동 확장 적용
- Pod 리소스 Request/Limit 최적화 (P50~P99 기반 Percentile 산정)
- 무중단 배포를 위한 Liveness/Readiness Probe 및 배포 전략 개선
기술 스택
주요 성과
- ✓ CoreDNS 리소스 증설 및 HPA 적용으로 DNS 장애 재발 방지
- ✓ Percentile 기반 리소스 산정으로 OOM 발생률 감소
- ✓ 네트워크 정책 점검으로 UDP 53 포트 차단 이슈 해결
- ✓ 장애 탐지 시간 단축 및 모니터링 대시보드 개선
Observability 체계 구축 및 SLO/SLI 자동화
DevOps Engineer SRE2023.01 - 2023.12
Prometheus, Grafana, CloudWatch를 활용한 모니터링 체계 고도화 및 SLO/SLI 알람 자동화
Observability 체계 구축 및 SLO/SLI 자동화
DevOps Engineer SRE2023.01 - 2023.12
Prometheus, Grafana, CloudWatch를 활용한 모니터링 체계 고도화 및 SLO/SLI 알람 자동화
담당 업무
- Prometheus + Grafana 기반 메트릭 수집 및 시각화 대시보드 구축
- Lambda를 활용한 SLO/SLI 계산 API 개발 및 DB 연동
- CloudWatch Application Signals 기반 SLO/SLI 알람 자동화 구현
- Fluentbit 기반 로그 수집 파이프라인 구축
- P95/P99 응답시간 기반 알람 체계 설계 (프론트엔드 P75/P90, 백엔드 P95/P99)
기술 스택
주요 성과
- ✓ SLO/SLI 기반 알람 시스템 도입으로 장애 대응 시간 단축
- ✓ Percentile 기반 모니터링으로 사용자 경험 이상 징후 조기 탐지
- ✓ 통합 Observability 대시보드 구축 (메트릭 + 로그 + 트레이스)
- ✓ P99 응답시간 임계치 알람으로 서비스 품질 관리 체계 확립
전사 SRE 확산 프로젝트
DevOps Engineer SRE2022.10 - 2023.03
AWS 기반 서비스에 대한 SRE 도입 및 전사 대시보드 연동, Critical API 기반 SLO/SLI 체계 구축
전사 SRE 확산 프로젝트
DevOps Engineer SRE2022.10 - 2023.03
AWS 기반 서비스에 대한 SRE 도입 및 전사 대시보드 연동, Critical API 기반 SLO/SLI 체계 구축
담당 업무
- 사내 SRE 교육 이수 및 4개 서비스 신규 On-boarding 수행
- Critical API 선정 기준 수립 및 SLI/SLO 지표 설계
- Lambda를 활용한 SLO/SLI 실시간 계산 및 전사 대시보드 DB 수집 파이프라인 구축
- Prometheus + Grafana 기반 메트릭 수집 및 시각화 대시보드 구축
- P95/P99 응답시간 기반 알람 체계 설계
- AWS Glue ETL Job Fail에 대한 EventBridge - Lambda Notification 구축
기술 스택
주요 성과
- ✓ 4개 서비스 SRE On-boarding 완료 및 전사 대시보드 연동
- ✓ SLO/SLI 기반 알람 시스템 도입으로 장애 대응 시간 단축
- ✓ Percentile 기반 모니터링으로 사용자 경험 이상 징후 조기 탐지
- ✓ ETL Job 실패 자동 알림으로 데이터 파이프라인 안정성 확보
사내 인사시스템 인프라 구축
DevOps Engineer2021.10 - 2022.08
GCP 기반 인사시스템 인프라 구축, VM 이미지 기반 무중단 배포, 해외 리전 DR 환경 구성
사내 인사시스템 인프라 구축
DevOps Engineer2021.10 - 2022.08
GCP 기반 인사시스템 인프라 구축, VM 이미지 기반 무중단 배포, 해외 리전 DR 환경 구성
담당 업무
- GCP 기반 인사시스템 Terraform Infra 환경 구성 (dev/stg/prd)
- VM 이미지 기반 Instance 무중단 배포 파이프라인 구성 (Blue/Green)
- Network 트러블슈팅 및 방화벽 규칙 관리
- 운영 RDS 데이터를 STG 환경으로 Data Sync 파이프라인 구축
- 해외 리전 재해복구 환경(DR) 구축 및 정기 재해복구 수행
- 신규 고객사 On-boarding (A사, B사, C사)
- 테스트 자동화 (SonarQube, JUnit)
기술 스택
주요 성과
- ✓ GCP 기반 멀티 환경 인프라를 IaC로 표준화하여 일관성 확보
- ✓ Blue/Green 배포로 무중단 서비스 운영 달성
- ✓ 정기 DR 수행으로 RTO/RPO 목표 달성 검증
- ✓ 3개 고객사 신규 On-boarding 완료
사내 회계시스템 인프라 관리 및 고객사 확장
DevOps Engineer2021.03 - 2021.09
사내 회계시스템 IaC 인프라 관리, 신규 고객사 On-boarding 및 보안 Compliance 수행
사내 회계시스템 인프라 관리 및 고객사 확장
DevOps Engineer2021.03 - 2021.09
사내 회계시스템 IaC 인프라 관리, 신규 고객사 On-boarding 및 보안 Compliance 수행
담당 업무
- 사내 회계시스템 IaC 기반 인프라 관리 및 개선 (DEV/STG/PRD)
- 신규 고객사(A사, B사) On-boarding Infra 환경 및 CI/CD 파이프라인 구축 (Blue/Green)
- 운영 RDS 데이터를 STG 환경으로 Data Sync 파이프라인 구축
- 보안 Compliance 수행 및 증적 제출 (ISMS, ISM, 클라우드보안)
- 신규 고객사 연동을 위한 Network 방화벽 관리
- 해외 리전 재해복구 환경(DR) 구축 및 정기 재해복구 수행
기술 스택
주요 성과
- ✓ 2개 고객사 신규 On-boarding 및 보안 Compliance 인증 완료
- ✓ Blue/Green 배포 기반 CI/CD로 무중단 서비스 운영
- ✓ ISMS, ISM 보안 감사 증적 제출 완료
- ✓ DR 환경 구축 및 정기 복구 수행으로 서비스 연속성 확보
대형 제조기업 전사 IT 인프라 관리
Infra Project Manager2018.07 - 2020.12
대형 제조기업 담당 전사 IT Infra PM으로서 전산실 모니터링 확산, 사무실 NW 구성, 인프라 증이설 프로젝트 수행
대형 제조기업 전사 IT 인프라 관리
Infra Project Manager2018.07 - 2020.12
대형 제조기업 담당 전사 IT Infra PM으로서 전산실 모니터링 확산, 사무실 NW 구성, 인프라 증이설 프로젝트 수행
담당 업무
- FMS(Facility Monitoring System) 전사 확산 프로젝트 수행 (제안, 계약, 이행, 검수)
- 신규 사업장 10개(국내7, 해외3) FMS 추가 구축 및 대시보드 연동
- 본사, 데이터센터 사무실 이전 Network 구성 (전력, 케이블, AP, NAC)
- 지방 공장 전산실 확산 구축 (Rack, UPS, 서버/NW 장비 이관)
- CAD 솔루션 신규 도입 및 Network 트러블슈팅
- 인프라 증이설 프로젝트 다수 수행
기술 스택
주요 성과
- ✓ 전사 10개 사업장 FMS 확산 구축으로 IT 인프라 모니터링 체계 표준화
- ✓ UDP 통신 기반 센서 데이터(누수, 화재, 온습도, UPS) 실시간 대시보드 구축
- ✓ 소규모 PM으로서 제안서 작성부터 검수까지 프로젝트 전 과정 독립 수행
- ✓ 사무실 이전 시 무중단 네트워크 전환 달성
사이드 프로젝트
여가 시간에 만든 토이 프로젝트
만다로그 (Mandalog)
Full-Stack Developer2025.01 - 현재
Mandalart 기반 목표 설계 및 일일 성과 측정 하이브리드 앱 개발
만다로그 (Mandalog)
Full-Stack Developer2025.01 - 현재
Mandalart 기반 목표 설계 및 일일 성과 측정 하이브리드 앱 개발
담당 업무
- Mandalart 9셀 구조 기반 목표 설계 시스템 구현 (중심 목표 + 8대 영역 + 64개 세부 목표)
- Google Calendar/Tasks OAuth 2.0 양방향 동기화 구현
- D3.js 기반 지식 그래프 네트워크 시각화 개발
- Recharts 기반 성장 메트릭 대시보드 (일/주/월/연 단위 필터링)
- Capacitor를 활용한 Android 하이브리드 앱 빌드 (AAB 번들)
- Fastlane + GitLab CI/CD 자동 빌드/배포 파이프라인 구축
- 다국어 지원 (한/영/일/중) 및 다크모드 테마 시스템 구현
기술 스택
주요 성과
- ✓ Mandalart 방법론을 디지털 앱으로 구현하여 목표-작업 연결 시각화
- ✓ Google 서비스 연동으로 기존 일정/작업과 실시간 양방향 동기화
- ✓ 오프라인 퍼스트 아키텍처 (LocalStorage 기반) 로 서버 의존성 제거
- ✓ 사업자 등록 완료 및 Google Play Store 출시 준비
Obsidian PARA 지식 관리 시스템
System Designer2025.01 - 현재
PARA 방법론 기반 개인 지식 관리 자동화 시스템 구축
Obsidian PARA 지식 관리 시스템
System Designer2025.01 - 현재
PARA 방법론 기반 개인 지식 관리 자동화 시스템 구축
담당 업무
- PARA 방법론 (Projects/Areas/Resources/Archives) 기반 vault 구조 설계 및 MOC 계층 구축
- Python 스크립트 (graph-report.py) 기반 vault 연결 분석 자동화 (고립 파일, 허브 노트, 깨진 링크 탐지)
- Templater 폴더 기반 자동 템플릿 시스템 구축 (9개 템플릿, 파일 생성 시 자동 적용)
- Dataview 기반 동적 대시보드 개발 (30+ 쿼리로 작업/프로젝트/영역별 다차원 필터링)
- 플러그인 자동 설치 스크립트 (install-plugins.sh) 개발로 새 기기 세팅 자동화
- Obsidian Git 30분 간격 자동 백업 + OneDrive 이중화 동기화 구성
기술 스택
주요 성과
- ✓ Vault 연결률 80%+ 유지, 고립 파일 15% 이하 관리 목표 달성
- ✓ 주간 그래프 보고서 자동 생성으로 지식 관리 건강도 정량 측정
- ✓ 9개 자동 템플릿으로 노트 생성 표준화 및 프론트매터 일관성 확보
- ✓ 새 기기 원커맨드 세팅 (10개 플러그인 + 설정 자동 적용)
포트폴리오 블로그
Full-Stack Developer2024.06 - 현재
Astro + AI 기반 자동 콘텐츠 생성 블로그 시스템
포트폴리오 블로그
Full-Stack Developer2024.06 - 현재
Astro + AI 기반 자동 콘텐츠 생성 블로그 시스템
담당 업무
- Astro 기반 정적 블로그 사이트 개발
- Claude API를 활용한 콘텐츠 자동 생성 파이프라인 구축
- GitHub Actions 기반 자동 포스팅 워크플로우 설계
기술 스택
주요 성과
- ✓ 일일 자동 포스팅으로 콘텐츠 생산성 향상
- ✓ Lighthouse 성능 점수 95+ 달성
독서로그
독서모임 · 독서리뷰
24권 읽음
관찰 가능성 엔지니어링
DevOps/SRECharity Majors, Liz Fong-Jones, George Miranda · 2025.09
메트릭 기반 모니터링을 넘어 관찰 가능성(Observability)의 본질을 다루는 책. 알려지지 않은 장애를 발견하고 추적하기 위한 계측, SLO 기반 운영, 샘플링 전략을 체계적으로 설명한다.
관찰 가능성 엔지니어링
DevOps/SRECharity Majors, Liz Fong-Jones, George Miranda · 2025.09
메트릭 기반 모니터링을 넘어 관찰 가능성(Observability)의 본질을 다루는 책. 알려지지 않은 장애를 발견하고 추적하기 위한 계측, SLO 기반 운영, 샘플링 전략을 체계적으로 설명한다.
리뷰
메트릭 기반 모니터링을 넘어 관찰 가능성(Observability)의 본질을 다루는 책. 알려지지 않은 장애를 발견하고 추적하기 위한 계측, SLO 기반 운영, 샘플링 전략을 체계적으로 설명한다.
핵심 노트
- ● 모니터링은 알려진 문제, 관찰 가능성은 알려지지 않은 문제를 발견
- ● SLO 소진 기반의 알림 전략과 에러 버짓 운영
- ● 고카디널리티 데이터와 구조화된 이벤트의 중요성
제로 트러스트 네트워크
보안/네트워크에반 길먼, 더그 바르트 · 2025.06
이미 해커가 네트워크 안에 있다는 가정에서 출발하는 보안 모델. 경계 기반 보안의 한계를 넘어 모든 통신 주체와 트래픽을 검증하는 제로 트러스트 아키텍처 구축 방법을 다룬다.
제로 트러스트 네트워크
보안/네트워크에반 길먼, 더그 바르트 · 2025.06
이미 해커가 네트워크 안에 있다는 가정에서 출발하는 보안 모델. 경계 기반 보안의 한계를 넘어 모든 통신 주체와 트래픽을 검증하는 제로 트러스트 아키텍처 구축 방법을 다룬다.
리뷰
이미 해커가 네트워크 안에 있다는 가정에서 출발하는 보안 모델. 경계 기반 보안의 한계를 넘어 모든 통신 주체와 트래픽을 검증하는 제로 트러스트 아키텍처 구축 방법을 다룬다.
핵심 노트
- ● 네트워크 경계가 아닌 각 요청 단위의 신뢰 검증
- ● 디바이스 신뢰, 사용자 신뢰, 애플리케이션 신뢰의 계층적 접근
- ● mTLS, SPIFFE 등 제로 트러스트 구현을 위한 실무 기술
코어 쿠버네티스
컨테이너/오케스트레이션제이 비아스, 크리스 러브 · 2025.03
쿠버네티스의 내부 구조와 동작 원리를 깊이 있게 다루는 책. API 서버, etcd, 스케줄러, 컨트롤러 매니저 등 핵심 컴포넌트의 상호작용을 이해하고 견고한 시스템을 구축하는 방법을 제시한다.
코어 쿠버네티스
컨테이너/오케스트레이션제이 비아스, 크리스 러브 · 2025.03
쿠버네티스의 내부 구조와 동작 원리를 깊이 있게 다루는 책. API 서버, etcd, 스케줄러, 컨트롤러 매니저 등 핵심 컴포넌트의 상호작용을 이해하고 견고한 시스템을 구축하는 방법을 제시한다.
리뷰
쿠버네티스의 내부 구조와 동작 원리를 깊이 있게 다루는 책. API 서버, etcd, 스케줄러, 컨트롤러 매니저 등 핵심 컴포넌트의 상호작용을 이해하고 견고한 시스템을 구축하는 방법을 제시한다.
핵심 노트
- ● 쿠버네티스 컨트롤 플레인의 내부 동작 원리
- ● API 서버와 etcd의 일관성 보장 메커니즘
- ● 스케줄러의 노드 선택 알고리즘과 커스텀 스케줄링
대용량 아키텍처와 성능 튜닝
아키텍처/성능조대협 · 2024.11
서버 사이드 대용량 시스템 설계와 성능 튜닝을 실용주의 관점에서 다루는 책. SOA, MSA, REST API 설계, 람다 아키텍처 등 아키텍처 패턴과 자바 기반 성능 최적화 기법을 포괄적으로 설명한다.
대용량 아키텍처와 성능 튜닝
아키텍처/성능조대협 · 2024.11
서버 사이드 대용량 시스템 설계와 성능 튜닝을 실용주의 관점에서 다루는 책. SOA, MSA, REST API 설계, 람다 아키텍처 등 아키텍처 패턴과 자바 기반 성능 최적화 기법을 포괄적으로 설명한다.
리뷰
서버 사이드 대용량 시스템 설계와 성능 튜닝을 실용주의 관점에서 다루는 책. SOA, MSA, REST API 설계, 람다 아키텍처 등 아키텍처 패턴과 자바 기반 성능 최적화 기법을 포괄적으로 설명한다.
핵심 노트
- ● SOA에서 MSA로의 아키텍처 진화와 트레이드오프
- ● REST API 설계 원칙과 대용량 트래픽 처리 전략
- ● JVM 튜닝, 캐시 전략, 비동기 처리를 통한 성능 최적화
클린 애자일
소프트웨어 공학로버트 C. 마틴 · 2024.06
애자일 선언의 초대 의장이었던 엉클 밥이 애자일의 본래 취지를 되짚는 책. 폭포수 모델의 대안으로 등장한 애자일의 가치와 XP 실천 방법을 새로운 세대에게 전달한다.
클린 애자일
소프트웨어 공학로버트 C. 마틴 · 2024.06
애자일 선언의 초대 의장이었던 엉클 밥이 애자일의 본래 취지를 되짚는 책. 폭포수 모델의 대안으로 등장한 애자일의 가치와 XP 실천 방법을 새로운 세대에게 전달한다.
리뷰
애자일 선언의 초대 의장이었던 엉클 밥이 애자일의 본래 취지를 되짚는 책. 폭포수 모델의 대안으로 등장한 애자일의 가치와 XP 실천 방법을 새로운 세대에게 전달한다.
핵심 노트
- ● 애자일은 작은 팀을 위한 작은 방법이지만 파급력은 크다
- ● XP 실천법: TDD, 페어 프로그래밍, 지속적 통합의 본질
- ● 추정과 계획의 균형 — 과도한 프로세스를 경계할 것
개발 7년차, 매니저 1일차
엔지니어링 리더십카미유 푸르니에 · 2024.03
개발자에서 테크리드, 팀장, CTO로 성장하며 겪는 매니지먼트의 현실적 문제를 다루는 책. 각 직책별 역할과 좋은 매니저의 모습을 구체적 사례로 보여준다.
개발 7년차, 매니저 1일차
엔지니어링 리더십카미유 푸르니에 · 2024.03
개발자에서 테크리드, 팀장, CTO로 성장하며 겪는 매니지먼트의 현실적 문제를 다루는 책. 각 직책별 역할과 좋은 매니저의 모습을 구체적 사례로 보여준다.
리뷰
개발자에서 테크리드, 팀장, CTO로 성장하며 겪는 매니지먼트의 현실적 문제를 다루는 책. 각 직책별 역할과 좋은 매니저의 모습을 구체적 사례로 보여준다.
핵심 노트
- ● 멘토링, 테크리드, 팀 관리의 단계별 리더십 역량
- ● 1:1 미팅과 피드백 문화의 중요성
- ● 기술 부채 관리와 팀 생산성의 균형 잡기