- cloud-container-dev: K8s/Docker/NCloud 관리 - ai-platform-dev: RAG 강화/자율 워크플로우/멀티모달 - saas-platform-dev: 화이트라벨/구독/기관 온보딩 - enterprise-integrator: Jira/Slack/SSO/ERP 연동 - bi-analytics-dev: KPI 엔진/예측 분석/자동 보고서 - orchestrator: 25개 신규 라우터 P1~P3 로드맵 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
230 lines
6.3 KiB
Markdown
230 lines
6.3 KiB
Markdown
# GUARDiA 플랫폼 확장 로드맵
|
|
|
|
## 현황 (2026-06-01 기준)
|
|
|
|
| 카테고리 | 구현 완료 | 미구현 |
|
|
|---------|---------|--------|
|
|
| ITSM 핵심 | SR, CMDB, CAB, Problem, SLA, SVC Catalog | — |
|
|
| AI/자동화 | Anomaly, Chatbot, Code Review, KB Agent, RPA, Scraping | RAG 강화, 자율 워크플로우, 멀티모달 |
|
|
| 인프라 | SSH, Scouter APM, infra_ext, shell_scripts | Kubernetes, Docker, NCloud |
|
|
| 보안 | LDAP, PAM, OTP, Vuln Scan, CSAP, Audit | SSO(SAML), 위협 헌팅 |
|
|
| 리포트 | analytics, sla, report, finops | KPI 엔진, 예측 분석, 벤치마킹 |
|
|
| 통합 | gateway, groupware | Jira, Slack, ServiceNow, ERP |
|
|
| SaaS | tenant_mgmt, license, onboarding | 화이트라벨, 구독, 과금 |
|
|
| SI 관리 | si_projects, si_wbs, si_milestones | — |
|
|
| DR/네트워크 | dr.py, network_devices.py | — |
|
|
|
|
---
|
|
|
|
## Phase 1 확장 (즉시 — P1)
|
|
|
|
### 1-1. AI RAG 강화 (`rag_engine.py`)
|
|
|
|
**목표:** 현재 단순 벡터 검색 → 하이브리드 검색(BM25+벡터) + 재순위화
|
|
|
|
```
|
|
현재: 쿼리 → pgvector → Ollama
|
|
목표: 쿼리 → BM25+pgvector → Cross-Encoder 재순위 → Ollama
|
|
```
|
|
|
|
**구현 포인트:**
|
|
- `pgvector` 기존 임베딩 재사용
|
|
- PostgreSQL FTS (Full-Text Search) 추가
|
|
- RRF(Reciprocal Rank Fusion) 결합 알고리즘
|
|
- 피드백 루프: 사용자 평점 → 검색 품질 개선
|
|
|
|
**예상 효과:** SR 자동 분류 정확도 15% 향상, 지식베이스 검색 응답 품질 개선
|
|
|
|
---
|
|
|
|
### 1-2. Jira 양방향 동기화 (`jira_sync.py`)
|
|
|
|
**목표:** SR ↔ Jira Issue 실시간 동기화
|
|
|
|
```
|
|
SR 생성 → Jira Issue 자동 생성
|
|
Jira 상태 변경 → SR 상태 자동 업데이트
|
|
코멘트 양방향 동기화
|
|
첨부파일 동기화
|
|
```
|
|
|
|
**구현 포인트:**
|
|
- Jira REST API v3 (Cloud) + Jira Server API
|
|
- Webhook 수신 (Jira → GUARDiA)
|
|
- 상태 매핑 테이블 (기관별 커스터마이즈)
|
|
- 멀티테넌트: 기관마다 별도 Jira 설정
|
|
|
|
---
|
|
|
|
### 1-3. KPI 엔진 (`kpi_engine.py`)
|
|
|
|
**목표:** 기관별 KPI 정의·계산·목표 추적 대시보드
|
|
|
|
```
|
|
지표 예시:
|
|
- MTTR (평균 복구 시간): 목표 < 4시간
|
|
- FCR (첫 번째 해결율): 목표 > 80%
|
|
- SLA 준수율: 목표 > 95%
|
|
- SR 적체율: 목표 < 10건
|
|
```
|
|
|
|
**구현 포인트:**
|
|
- KPI 정의는 SQL/Python 식으로 커스터마이즈
|
|
- 일별/주별/월별 자동 계산 (APScheduler)
|
|
- 목표 대비 신호등 상태 (RED/YELLOW/GREEN)
|
|
- 기존 `analytics.py` 데이터 재사용
|
|
|
|
---
|
|
|
|
### 1-4. 테넌트 셀프서비스 포털 (`tenant_portal.py`)
|
|
|
|
**목표:** 기관 관리자가 직접 설정 관리 (GUARDiA Manager 연동)
|
|
|
|
```
|
|
기관 관리자 권한:
|
|
- 사용자 등록/삭제/역할 변경
|
|
- 서버 자산 등록
|
|
- 알림 설정 (수신자, 임계값)
|
|
- 비밀번호 정책 설정
|
|
```
|
|
|
|
---
|
|
|
|
## Phase 2 확장 (1~2개월 — P2)
|
|
|
|
### 2-1. Kubernetes 관리 (`kubernetes.py`)
|
|
|
|
**에이전트리스 K8s 관리:**
|
|
```bash
|
|
# SSH 경유 kubectl 실행
|
|
ssh opsagent@k8s-master "kubectl get pods -n production -o json"
|
|
ssh opsagent@k8s-master "kubectl rollout restart deployment/app"
|
|
```
|
|
|
|
**기능 목록:**
|
|
- 클러스터/네임스페이스/Pod 현황 조회
|
|
- Deployment 롤링 업데이트 트리거
|
|
- HPA(수평 자동 확장) 현황 조회
|
|
- Pod 로그 실시간 스트리밍 (WebSocket)
|
|
- 리소스 사용률 수집 (CPU/메모리/디스크)
|
|
|
|
---
|
|
|
|
### 2-2. 자율 워크플로우 엔진 (`autonomous_workflow.py`)
|
|
|
|
**현재 autonomous.py 확장:**
|
|
```python
|
|
# 기존: 단순 자동 승인 큐
|
|
# 목표: 조건 기반 자동 실행 워크플로우
|
|
{
|
|
"trigger": "SR_CREATED",
|
|
"condition": "sr.category == 'MONITORING' AND sr.priority < 3",
|
|
"actions": [
|
|
{"type": "AUTO_ASSIGN", "rule": "ROUND_ROBIN"},
|
|
{"type": "NOTIFY", "channel": "messenger"},
|
|
{"type": "HEALTH_CHECK", "delay_minutes": 5}
|
|
],
|
|
"approval_required": false
|
|
}
|
|
```
|
|
|
|
---
|
|
|
|
### 2-3. SSO 통합 (`sso_provider.py`)
|
|
|
|
**행정안전부 공통로그인 + 기업 IdP 지원:**
|
|
- SAML 2.0 (행정안전부 GPKI, 국가정보자원관리원)
|
|
- OIDC/OAuth2 (Google Workspace, Microsoft Entra)
|
|
- LDAP/AD (기존 `ldap.py` 활용)
|
|
|
|
---
|
|
|
|
### 2-4. 예측 운영 분석 (`predictive_ops.py`)
|
|
|
|
**기존 predictive.py 고도화:**
|
|
```python
|
|
# 7일 후 장애 발생 확률 예측
|
|
{
|
|
"server_id": 42,
|
|
"failure_probability_7d": 0.78,
|
|
"main_indicators": ["CPU 트렌드", "디스크 증가율"],
|
|
"recommended_action": "긴급 점검 SR 생성",
|
|
"confidence": 0.85
|
|
}
|
|
```
|
|
|
|
---
|
|
|
|
## Phase 3 확장 (3~6개월 — P3)
|
|
|
|
### 3-1. 구독·과금 시스템 (`subscription.py`, `billing.py`)
|
|
|
|
```
|
|
플랜: COMMUNITY → STANDARD → ENTERPRISE
|
|
서버 수: 20 → 200 → 무제한
|
|
사용자 수: 10 → 100 → 무제한
|
|
가격(월): 무료 → 50만원 → 협의
|
|
청구 주기: 월납 / 연납 (10% 할인)
|
|
```
|
|
|
|
### 3-2. 멀티모달 AI (`multimodal.py`)
|
|
|
|
```
|
|
입력: 스크린샷, 로그 파일, 에러 이미지
|
|
처리: Ollama llava 모델
|
|
출력: 에러 분류, 해결 방법, SR 자동 생성
|
|
```
|
|
|
|
### 3-3. 기관 간 벤치마킹 (`benchmark.py`)
|
|
|
|
```
|
|
익명화된 업계 평균과 비교:
|
|
- 우리 기관 MTTR vs 공공기관 평균 MTTR
|
|
- SR 처리 속도 순위 (익명 백분위)
|
|
- SLA 준수율 업계 평균 대비
|
|
```
|
|
|
|
### 3-4. Self-Improving Learning Loop (`learning_loop.py`)
|
|
|
|
```
|
|
1. 사용자 피드백 수집 (AI 응답 평가)
|
|
2. 저품질 응답 샘플 수집
|
|
3. Ollama 파인튜닝 데이터셋 생성
|
|
4. 모델 파인튜닝 (주 1회 자동 실행)
|
|
5. 성능 비교 후 배포 (A/B 테스트)
|
|
```
|
|
|
|
---
|
|
|
|
## 신규 라우터 목록 (전체)
|
|
|
|
| 영역 | 파일명 | 우선순위 |
|
|
|------|-------|---------|
|
|
| Cloud | kubernetes.py | P2 |
|
|
| Cloud | docker_mgr.py | P2 |
|
|
| Cloud | ncloud.py | P3 |
|
|
| Cloud | container_alerts.py | P2 |
|
|
| AI | rag_engine.py | **P1** |
|
|
| AI | autonomous_workflow.py | P2 |
|
|
| AI | ai_insights.py | P2 |
|
|
| AI | multimodal.py | P3 |
|
|
| AI | learning_loop.py | P3 |
|
|
| SaaS | tenant_portal.py | **P1** |
|
|
| SaaS | white_label.py | P2 |
|
|
| SaaS | subscription.py | P3 |
|
|
| SaaS | billing.py | P3 |
|
|
| Integration | jira_sync.py | **P1** |
|
|
| Integration | slack_connector.py | P2 |
|
|
| Integration | servicenow.py | P3 |
|
|
| Integration | erp_connector.py | P2 |
|
|
| Integration | sso_provider.py | P2 |
|
|
| Integration | kakao_notify.py | P2 |
|
|
| BI | bi_dashboard.py | **P1** |
|
|
| BI | kpi_engine.py | **P1** |
|
|
| BI | predictive_ops.py | P2 |
|
|
| BI | auto_report.py | P2 |
|
|
| BI | benchmark.py | P3 |
|
|
| BI | cohort_analysis.py | P3 |
|
|
|
|
**총 25개 신규 라우터** (P1: 6개, P2: 11개, P3: 8개)
|