zioinfo-mail/.claude/skills/guardia-expansion-orchestrator/references/expansion-roadmap.md
DESKTOP-TKLFCPR\ython 373ffb9536 feat(harness): GUARDiA expansion harness — 5 domain agents + orchestrator
- cloud-container-dev: K8s/Docker/NCloud 관리
- ai-platform-dev: RAG 강화/자율 워크플로우/멀티모달
- saas-platform-dev: 화이트라벨/구독/기관 온보딩
- enterprise-integrator: Jira/Slack/SSO/ERP 연동
- bi-analytics-dev: KPI 엔진/예측 분석/자동 보고서
- orchestrator: 25개 신규 라우터 P1~P3 로드맵

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-06-01 22:25:51 +09:00

6.3 KiB

GUARDiA 플랫폼 확장 로드맵

현황 (2026-06-01 기준)

카테고리 구현 완료 미구현
ITSM 핵심 SR, CMDB, CAB, Problem, SLA, SVC Catalog
AI/자동화 Anomaly, Chatbot, Code Review, KB Agent, RPA, Scraping RAG 강화, 자율 워크플로우, 멀티모달
인프라 SSH, Scouter APM, infra_ext, shell_scripts Kubernetes, Docker, NCloud
보안 LDAP, PAM, OTP, Vuln Scan, CSAP, Audit SSO(SAML), 위협 헌팅
리포트 analytics, sla, report, finops KPI 엔진, 예측 분석, 벤치마킹
통합 gateway, groupware Jira, Slack, ServiceNow, ERP
SaaS tenant_mgmt, license, onboarding 화이트라벨, 구독, 과금
SI 관리 si_projects, si_wbs, si_milestones
DR/네트워크 dr.py, network_devices.py

Phase 1 확장 (즉시 — P1)

1-1. AI RAG 강화 (rag_engine.py)

목표: 현재 단순 벡터 검색 → 하이브리드 검색(BM25+벡터) + 재순위화

현재: 쿼리 → pgvector → Ollama
목표: 쿼리 → BM25+pgvector → Cross-Encoder 재순위 → Ollama

구현 포인트:

  • pgvector 기존 임베딩 재사용
  • PostgreSQL FTS (Full-Text Search) 추가
  • RRF(Reciprocal Rank Fusion) 결합 알고리즘
  • 피드백 루프: 사용자 평점 → 검색 품질 개선

예상 효과: SR 자동 분류 정확도 15% 향상, 지식베이스 검색 응답 품질 개선


1-2. Jira 양방향 동기화 (jira_sync.py)

목표: SR ↔ Jira Issue 실시간 동기화

SR 생성 → Jira Issue 자동 생성
Jira 상태 변경 → SR 상태 자동 업데이트
코멘트 양방향 동기화
첨부파일 동기화

구현 포인트:

  • Jira REST API v3 (Cloud) + Jira Server API
  • Webhook 수신 (Jira → GUARDiA)
  • 상태 매핑 테이블 (기관별 커스터마이즈)
  • 멀티테넌트: 기관마다 별도 Jira 설정

1-3. KPI 엔진 (kpi_engine.py)

목표: 기관별 KPI 정의·계산·목표 추적 대시보드

지표 예시:
- MTTR (평균 복구 시간): 목표 < 4시간
- FCR (첫 번째 해결율): 목표 > 80%
- SLA 준수율: 목표 > 95%
- SR 적체율: 목표 < 10건

구현 포인트:

  • KPI 정의는 SQL/Python 식으로 커스터마이즈
  • 일별/주별/월별 자동 계산 (APScheduler)
  • 목표 대비 신호등 상태 (RED/YELLOW/GREEN)
  • 기존 analytics.py 데이터 재사용

1-4. 테넌트 셀프서비스 포털 (tenant_portal.py)

목표: 기관 관리자가 직접 설정 관리 (GUARDiA Manager 연동)

기관 관리자 권한:
- 사용자 등록/삭제/역할 변경
- 서버 자산 등록
- 알림 설정 (수신자, 임계값)
- 비밀번호 정책 설정

Phase 2 확장 (1~2개월 — P2)

2-1. Kubernetes 관리 (kubernetes.py)

에이전트리스 K8s 관리:

# SSH 경유 kubectl 실행
ssh opsagent@k8s-master "kubectl get pods -n production -o json"
ssh opsagent@k8s-master "kubectl rollout restart deployment/app"

기능 목록:

  • 클러스터/네임스페이스/Pod 현황 조회
  • Deployment 롤링 업데이트 트리거
  • HPA(수평 자동 확장) 현황 조회
  • Pod 로그 실시간 스트리밍 (WebSocket)
  • 리소스 사용률 수집 (CPU/메모리/디스크)

2-2. 자율 워크플로우 엔진 (autonomous_workflow.py)

현재 autonomous.py 확장:

# 기존: 단순 자동 승인 큐
# 목표: 조건 기반 자동 실행 워크플로우
{
  "trigger": "SR_CREATED",
  "condition": "sr.category == 'MONITORING' AND sr.priority < 3",
  "actions": [
    {"type": "AUTO_ASSIGN", "rule": "ROUND_ROBIN"},
    {"type": "NOTIFY", "channel": "messenger"},
    {"type": "HEALTH_CHECK", "delay_minutes": 5}
  ],
  "approval_required": false
}

2-3. SSO 통합 (sso_provider.py)

행정안전부 공통로그인 + 기업 IdP 지원:

  • SAML 2.0 (행정안전부 GPKI, 국가정보자원관리원)
  • OIDC/OAuth2 (Google Workspace, Microsoft Entra)
  • LDAP/AD (기존 ldap.py 활용)

2-4. 예측 운영 분석 (predictive_ops.py)

기존 predictive.py 고도화:

# 7일 후 장애 발생 확률 예측
{
  "server_id": 42,
  "failure_probability_7d": 0.78,
  "main_indicators": ["CPU 트렌드", "디스크 증가율"],
  "recommended_action": "긴급 점검 SR 생성",
  "confidence": 0.85
}

Phase 3 확장 (3~6개월 — P3)

3-1. 구독·과금 시스템 (subscription.py, billing.py)

플랜:         COMMUNITY → STANDARD → ENTERPRISE
서버 수:      20 → 200 → 무제한
사용자 수:    10 → 100 → 무제한
가격(월):     무료 → 50만원 → 협의
청구 주기:    월납 / 연납 (10% 할인)

3-2. 멀티모달 AI (multimodal.py)

입력: 스크린샷, 로그 파일, 에러 이미지
처리: Ollama llava 모델
출력: 에러 분류, 해결 방법, SR 자동 생성

3-3. 기관 간 벤치마킹 (benchmark.py)

익명화된 업계 평균과 비교:
- 우리 기관 MTTR vs 공공기관 평균 MTTR
- SR 처리 속도 순위 (익명 백분위)
- SLA 준수율 업계 평균 대비

3-4. Self-Improving Learning Loop (learning_loop.py)

1. 사용자 피드백 수집 (AI 응답 평가)
2. 저품질 응답 샘플 수집
3. Ollama 파인튜닝 데이터셋 생성
4. 모델 파인튜닝 (주 1회 자동 실행)
5. 성능 비교 후 배포 (A/B 테스트)

신규 라우터 목록 (전체)

영역 파일명 우선순위
Cloud kubernetes.py P2
Cloud docker_mgr.py P2
Cloud ncloud.py P3
Cloud container_alerts.py P2
AI rag_engine.py P1
AI autonomous_workflow.py P2
AI ai_insights.py P2
AI multimodal.py P3
AI learning_loop.py P3
SaaS tenant_portal.py P1
SaaS white_label.py P2
SaaS subscription.py P3
SaaS billing.py P3
Integration jira_sync.py P1
Integration slack_connector.py P2
Integration servicenow.py P3
Integration erp_connector.py P2
Integration sso_provider.py P2
Integration kakao_notify.py P2
BI bi_dashboard.py P1
BI kpi_engine.py P1
BI predictive_ops.py P2
BI auto_report.py P2
BI benchmark.py P3
BI cohort_analysis.py P3

총 25개 신규 라우터 (P1: 6개, P2: 11개, P3: 8개)