"흥미가 있어야 지속이 가능하다" - AI와 새로운 기술에 대한 끊임없는 호기심으로 성장하는 개발자입니다.
안녕하세요! 저는 AI 모델을 실제 서비스로 만드는 것을 좋아하는 AI 백엔드 엔지니어입니다. Vision AI와 LLM 기술을 활용하여 빠르고 신뢰할 수 있는 AI 시스템을 설계하고 구현합니다. 새로운 기술을 습득하고 팀과의 소통을 통해 함께 성장하기를 원합니다.
📍 현재 Deepvisions AI Engineer로 재직 중 (2026.03 ~) 드론·CCTV·엣지 디바이스 기반 Vision AI 프로젝트를 담당하고 있습니다.
| 핵심 가치 | 설명 |
|---|---|
| 🔬 Experiment & Validation | 실험과 검증을 통해 모델 성능을 개선합니다 |
| 📊 Data-driven Development | 데이터 기반 접근으로 문제를 해결합니다 |
| ⚙️ System Thinking | 모델뿐 아니라 전체 시스템 관점에서 설계합니다 |
| 🚀 Execution | 빠른 실행과 반복을 통해 개선합니다 |
| 🪤 Honest Limitation | 결과의 한계를 명시하고 다음 단계로 연결합니다 |
🎨 Generative & Vision AI
- Stable Diffusion XL, Inpainting 모델 구현 및 최적화
- SAM / SAM2 / SAM3 text prompt (Object Detection, Instance Segmentation, Zero-shot text-conditioned)
- YOLOv8 / YOLO11 / Grounding DINO 기반 비전 파이프라인
- 4-way fair-chain 학습 비교 (data ablation)
- LoRA Fine-tuning 경험
🔗 LLM & AI Integration
- LangChain 기반 멀티스텝 AI 파이프라인
- RAG (Retrieval-Augmented Generation) 구현
- Prompt Engineering & Model serving
⚙️ Backend & Deployment
- FastAPI로 AI 모델 serving
- GCP 기반 AI 백엔드 서버 구축 및 배포
- HuggingFace 모델 최적화 및 로딩
- Raspberry Pi 엣지 디바이스 배포 (Yolov8n 야생동물 알림 시스템)
🚀 Performance & Optimization
- CUDA 기반 GPU 학습 및 추론 최적화
- SAHI 기반 small object detection (drone, CCTV)
- Multi-dataset 일반화 (WGISD / 자체 라벨링 / mixed)
- 모델 성능 분석 및 개선
🎯 Domain-specific Pipelines
- GSD calibration (reference object → cm/px → 실제 크기 측정)
- Multi-view / multi-angle fusion
- Synthetic data 생성 (vineyard composite, Poisson seamless cloning)
2026.03 ~ 재직중
드론·CCTV·엣지 디바이스 기반 Vision AI 파이프라인을 담당하고 있습니다. 농업 (포도밭 송이 탐지·수확량 예측·야생동물 침입 알림)과 도시 인프라 (CCTV 자전거 경로·차량 공회전·브레이크등 분류)에서 모델 학습부터 엣지 배포까지 E2E로 진행합니다.
- 🚲 CCTV 자전거 경로 / 차량 공회전 / 후미등 분류 (한동대학교 리빙랩) @ Deepvisions
- 🐗 야생동물 RPi 엣지 배포 (포도밭 침입 알림) @ Deepvisions
- 🍇 포도밭 수확량 예측 파이프라인 (Drone + GSD + Segmentation → Yield estimation) @ Deepvisions
- YOLO + SAM3 → 송이 mask → cm2 → 무게 환산
- 흰 보드 (close-up) → 기둥 (drone) reference 전환 준비
- 회귀 모델 PoC (overfit 인지, 50+ GT 추가 수집 단계)
- 🌟 Vision AI Pipeline Optimization (small object, multi-domain)
AI 모델 연구부터 프로덕션 배포까지의 전체 과정을 기록하고 있습니다:
- 🎨 Generative AI: Stable Diffusion XL, Inpainting, SAM 기반 이미지 생성/편집
- 🔍 Object Detection & Segmentation: SAM, SAM3, YOLO, Grounding DINO, SAHI
- 🍇 농업 Vision AI: 드론 기반 포도밭 탐지 + 수확량 예측, 합성 데이터 생성
- 🛰️ 엣지 / CCTV 배포: RPi 야생동물 알림, 자전거 공회전 탐지, 브레이크등 분류
- 💬 LLM & RAG: LangChain 기반 멀티스텝 AI
- ☁️ 클라우드 / 백엔드: GCP에서의 AI 서버 구축, FastAPI 마이크로서비스
- ⚙️ 모델 최적화: CUDA 성능 개선, HuggingFace 모델 서빙
2026.05 ~ 진행중 | @ Deepvisions
한동대학교 리빙랩 캠퍼스 CCTV 4대 영상에서 자전거 경로 추적 + 차량 공회전 탐지 + 브레이크등 분류.
- 3-Model 비교 (YOLOv8 / YOLO11 / 별도 EfficientNet-B0 분류기)
- 부감 시점 도메인 갭 + boarding 상태기계 + 다중 신호 fusion
- Live frame 처리 파이프라인
- 📖 Bike Idle Detection (메인)
- 📖 Idle Detection Pipeline
- 📖 Brakelight Classifier
2026.04 ~ 진행중 | @ Deepvisions
YOLO11n + Raspberry Pi 4 기반 농지 야생동물 침입 알림 시스템.
- 5종 multi-class (노루·멧돼지·오소리·너구리·조류) detection
- ncnn FP16 추론 + picamera2 실시간 캡처
- INT8 양자화 진단 + CPU-only 5 FPS 운용 검증
- 📖 Wildlife Guard (메인)
🍇 포도밭 송이 탐지 + 수확량 예측 (Drone ×ばつ Vision AI)
×ばつ Vision AI)" href="#-포도밭-송이-탐지--수확량-예측-drone--vision-ai">2026.03 ~ 진행중 | @ Deepvisions
드론 영상 → 송이 검출 → 면적 측정 → 무게 추정 → 밭 단위 수확량(kg) E2E 파이프라인.
- Detection 단계: YOLOv8 / YOLO11 mixed-best + fair-chain 학습 비교, SAHI tiling (mAP50-95 plateau 0.286 확인)
- Segmentation 단계: SAM3 text prompt + box prompt, mask NMS / clip / argmax resolve
- GSD calibration: 보드 16cm (close-up) / 기둥 6cm (drone) reference로 cm/px 산출
- 무게 환산: 면적 → 부피(A^1.5) vs 회귀(A^0.78) 모델 비교, GT 검증으로 한계 명확화
- 결과 (close-up 4 송이 GT): 총합 오차 −3.1% (SAM3 + 회귀), 4 점 fit 한계 인지 후 50+ GT 추가 수집 계획
- 📖 Close-up Test 2026年05月19日 (최신)
- 📖 Yield Pipeline (2026-05)
- 📖 Detection Progression (2026-04)
2025.03 ~ 2025.08 | 카카오테크부트캠프 생성형 AI과정 | ✅ 종료
Stable Diffusion XL과 SAM을 활용한 E2E 이미지 생성 파이프라인.
- 객체 인식 → 프롬프트 생성 → 이미지 인페인팅 전체 파이프라인 설계
- 응답 시간, API 구조, 운영 가능성을 고려한 백엔드 아키텍처
- Live:
(削除) onthe-top.com (削除ここまで)(서비스 종료) - 📖 상세 프로젝트 Wiki
- 📧 GitHub: @ehdwo0427
- 📖 Wiki: Study Repository Wiki
항상 배우는 마음으로, 함께 성장하겠습니다! 🌱