zioinfo-mail/.claude/skills/guardia-expansion-orchestrator/references/expansion-roadmap.md
DESKTOP-TKLFCPR\ython 373ffb9536 feat(harness): GUARDiA expansion harness — 5 domain agents + orchestrator
- cloud-container-dev: K8s/Docker/NCloud 관리
- ai-platform-dev: RAG 강화/자율 워크플로우/멀티모달
- saas-platform-dev: 화이트라벨/구독/기관 온보딩
- enterprise-integrator: Jira/Slack/SSO/ERP 연동
- bi-analytics-dev: KPI 엔진/예측 분석/자동 보고서
- orchestrator: 25개 신규 라우터 P1~P3 로드맵

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-06-01 22:25:51 +09:00

230 lines
6.3 KiB
Markdown

# GUARDiA 플랫폼 확장 로드맵
## 현황 (2026-06-01 기준)
| 카테고리 | 구현 완료 | 미구현 |
|---------|---------|--------|
| ITSM 핵심 | SR, CMDB, CAB, Problem, SLA, SVC Catalog | — |
| AI/자동화 | Anomaly, Chatbot, Code Review, KB Agent, RPA, Scraping | RAG 강화, 자율 워크플로우, 멀티모달 |
| 인프라 | SSH, Scouter APM, infra_ext, shell_scripts | Kubernetes, Docker, NCloud |
| 보안 | LDAP, PAM, OTP, Vuln Scan, CSAP, Audit | SSO(SAML), 위협 헌팅 |
| 리포트 | analytics, sla, report, finops | KPI 엔진, 예측 분석, 벤치마킹 |
| 통합 | gateway, groupware | Jira, Slack, ServiceNow, ERP |
| SaaS | tenant_mgmt, license, onboarding | 화이트라벨, 구독, 과금 |
| SI 관리 | si_projects, si_wbs, si_milestones | — |
| DR/네트워크 | dr.py, network_devices.py | — |
---
## Phase 1 확장 (즉시 — P1)
### 1-1. AI RAG 강화 (`rag_engine.py`)
**목표:** 현재 단순 벡터 검색 → 하이브리드 검색(BM25+벡터) + 재순위화
```
현재: 쿼리 → pgvector → Ollama
목표: 쿼리 → BM25+pgvector → Cross-Encoder 재순위 → Ollama
```
**구현 포인트:**
- `pgvector` 기존 임베딩 재사용
- PostgreSQL FTS (Full-Text Search) 추가
- RRF(Reciprocal Rank Fusion) 결합 알고리즘
- 피드백 루프: 사용자 평점 → 검색 품질 개선
**예상 효과:** SR 자동 분류 정확도 15% 향상, 지식베이스 검색 응답 품질 개선
---
### 1-2. Jira 양방향 동기화 (`jira_sync.py`)
**목표:** SR ↔ Jira Issue 실시간 동기화
```
SR 생성 → Jira Issue 자동 생성
Jira 상태 변경 → SR 상태 자동 업데이트
코멘트 양방향 동기화
첨부파일 동기화
```
**구현 포인트:**
- Jira REST API v3 (Cloud) + Jira Server API
- Webhook 수신 (Jira → GUARDiA)
- 상태 매핑 테이블 (기관별 커스터마이즈)
- 멀티테넌트: 기관마다 별도 Jira 설정
---
### 1-3. KPI 엔진 (`kpi_engine.py`)
**목표:** 기관별 KPI 정의·계산·목표 추적 대시보드
```
지표 예시:
- MTTR (평균 복구 시간): 목표 < 4시간
- FCR (첫 번째 해결율): 목표 > 80%
- SLA 준수율: 목표 > 95%
- SR 적체율: 목표 < 10건
```
**구현 포인트:**
- KPI 정의는 SQL/Python 식으로 커스터마이즈
- 일별/주별/월별 자동 계산 (APScheduler)
- 목표 대비 신호등 상태 (RED/YELLOW/GREEN)
- 기존 `analytics.py` 데이터 재사용
---
### 1-4. 테넌트 셀프서비스 포털 (`tenant_portal.py`)
**목표:** 기관 관리자가 직접 설정 관리 (GUARDiA Manager 연동)
```
기관 관리자 권한:
- 사용자 등록/삭제/역할 변경
- 서버 자산 등록
- 알림 설정 (수신자, 임계값)
- 비밀번호 정책 설정
```
---
## Phase 2 확장 (1~2개월 — P2)
### 2-1. Kubernetes 관리 (`kubernetes.py`)
**에이전트리스 K8s 관리:**
```bash
# SSH 경유 kubectl 실행
ssh opsagent@k8s-master "kubectl get pods -n production -o json"
ssh opsagent@k8s-master "kubectl rollout restart deployment/app"
```
**기능 목록:**
- 클러스터/네임스페이스/Pod 현황 조회
- Deployment 롤링 업데이트 트리거
- HPA(수평 자동 확장) 현황 조회
- Pod 로그 실시간 스트리밍 (WebSocket)
- 리소스 사용률 수집 (CPU/메모리/디스크)
---
### 2-2. 자율 워크플로우 엔진 (`autonomous_workflow.py`)
**현재 autonomous.py 확장:**
```python
# 기존: 단순 자동 승인 큐
# 목표: 조건 기반 자동 실행 워크플로우
{
"trigger": "SR_CREATED",
"condition": "sr.category == 'MONITORING' AND sr.priority < 3",
"actions": [
{"type": "AUTO_ASSIGN", "rule": "ROUND_ROBIN"},
{"type": "NOTIFY", "channel": "messenger"},
{"type": "HEALTH_CHECK", "delay_minutes": 5}
],
"approval_required": false
}
```
---
### 2-3. SSO 통합 (`sso_provider.py`)
**행정안전부 공통로그인 + 기업 IdP 지원:**
- SAML 2.0 (행정안전부 GPKI, 국가정보자원관리원)
- OIDC/OAuth2 (Google Workspace, Microsoft Entra)
- LDAP/AD (기존 `ldap.py` 활용)
---
### 2-4. 예측 운영 분석 (`predictive_ops.py`)
**기존 predictive.py 고도화:**
```python
# 7일 후 장애 발생 확률 예측
{
"server_id": 42,
"failure_probability_7d": 0.78,
"main_indicators": ["CPU 트렌드", "디스크 증가율"],
"recommended_action": "긴급 점검 SR 생성",
"confidence": 0.85
}
```
---
## Phase 3 확장 (3~6개월 — P3)
### 3-1. 구독·과금 시스템 (`subscription.py`, `billing.py`)
```
플랜: COMMUNITY → STANDARD → ENTERPRISE
서버 수: 20 → 200 → 무제한
사용자 수: 10 → 100 → 무제한
가격(월): 무료 → 50만원 → 협의
청구 주기: 월납 / 연납 (10% 할인)
```
### 3-2. 멀티모달 AI (`multimodal.py`)
```
입력: 스크린샷, 로그 파일, 에러 이미지
처리: Ollama llava 모델
출력: 에러 분류, 해결 방법, SR 자동 생성
```
### 3-3. 기관 간 벤치마킹 (`benchmark.py`)
```
익명화된 업계 평균과 비교:
- 우리 기관 MTTR vs 공공기관 평균 MTTR
- SR 처리 속도 순위 (익명 백분위)
- SLA 준수율 업계 평균 대비
```
### 3-4. Self-Improving Learning Loop (`learning_loop.py`)
```
1. 사용자 피드백 수집 (AI 응답 평가)
2. 저품질 응답 샘플 수집
3. Ollama 파인튜닝 데이터셋 생성
4. 모델 파인튜닝 (주 1회 자동 실행)
5. 성능 비교 후 배포 (A/B 테스트)
```
---
## 신규 라우터 목록 (전체)
| 영역 | 파일명 | 우선순위 |
|------|-------|---------|
| Cloud | kubernetes.py | P2 |
| Cloud | docker_mgr.py | P2 |
| Cloud | ncloud.py | P3 |
| Cloud | container_alerts.py | P2 |
| AI | rag_engine.py | **P1** |
| AI | autonomous_workflow.py | P2 |
| AI | ai_insights.py | P2 |
| AI | multimodal.py | P3 |
| AI | learning_loop.py | P3 |
| SaaS | tenant_portal.py | **P1** |
| SaaS | white_label.py | P2 |
| SaaS | subscription.py | P3 |
| SaaS | billing.py | P3 |
| Integration | jira_sync.py | **P1** |
| Integration | slack_connector.py | P2 |
| Integration | servicenow.py | P3 |
| Integration | erp_connector.py | P2 |
| Integration | sso_provider.py | P2 |
| Integration | kakao_notify.py | P2 |
| BI | bi_dashboard.py | **P1** |
| BI | kpi_engine.py | **P1** |
| BI | predictive_ops.py | P2 |
| BI | auto_report.py | P2 |
| BI | benchmark.py | P3 |
| BI | cohort_analysis.py | P3 |
**총 25개 신규 라우터** (P1: 6개, P2: 11개, P3: 8개)