zioinfo-mail/itsm/CLAUDE.md
DESKTOP-TKLFCPR\ython e228faabf5 feat(itsm): G-1~G-12 확장 기능 + 하네스/봇/설치스크립트 구현
G-1: 메신저 Webhook Relay + _send_to_room 실제 httpx 호출 구현
G-2: POST /api/tasks/bulk SR 대량작업 엔드포인트 (최대 100건)
G-3: 라이선스 만료 알림 스케줄러 (매일 09:00 KST)
G-4: 체험판 upgrade_banner 필드 + license.py 배너 로직
G-5: core/auto_rca.py + incidents/problem auto-rca 엔드포인트
G-6: core/deploy_impact.py + vibe impact-analysis 엔드포인트
G-7: core/ticket_classifier.py + SR 생성 시 AI 분류 + ai-suggestion API
G-8: VulnPatchRecord 모델 + vuln_scan 패치추적 4개 엔드포인트
G-9: core/jira_sync.py + gateway Jira/Confluence 연동 엔드포인트
G-10: core/push_notify.py + routers/push.py + PushSubscription 모델
G-11: approvals 다중승인 (위임/서명/기한초과/마감연장)
G-12: alembic.ini + migrations/ + cicd/migrate_to_postgres.sh

하네스: guardia-orchestrator 확장기능 Phase 반영
봇명령어: /sr /status /license /bulk 슬래시 명령어 추가
설치스크립트: setup/ (Ubuntu, CentOS, RHEL, Windows) --test 옵션 포함

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-29 18:18:52 +09:00

144 lines
7.2 KiB
Markdown

# GUARDiA ITSM — AI 기반 레거시 인프라 자율 운영 플랫폼
## Claude Code 프로젝트 마스터 컨텍스트
> 이 파일을 읽고 프로젝트 전체 구조와 규칙을 파악한 뒤 작업을 시작하라.
---
## 프로젝트 비전
1,000개 이상 다중 관공서(Multi-tenant) 레거시 인프라를 타겟으로 하는
**AI 기반 통합 ChatOps 오케스트레이션 플랫폼**.
- 메신저 한 줄 명령 → sLLM 파싱 → 에이전트리스(SSH/SFTP) 배포·운영 자동화
- 에이전트 설치 **불필요** — 표준 SSH/FTP 프로토콜만 활용
- 개발(Dev), SM 운영, PM 관리 세 역할의 워크플로우를 단일 메신저로 통합
- **온프레미스 전용**: 외부 클라우드 API 완전 금지 (Ollama 내부 LLM만 허용)
---
## 기술 스택
| 레이어 | 기술 | 비고 |
|--------|------|------|
| Backend API | Python 3.11+ / FastAPI | 비동기 WebSocket 처리 |
| LLM | Ollama localhost:11434 (codellama, llama3) | 외부 API 완전 금지 |
| Infra 연결 | paramiko (SSH/SFTP) | 에이전트리스 |
| Database | SQLite (dev) / PostgreSQL (prod) | SQLAlchemy async |
| 암호화 | AES-256-GCM (서버 자격증명) | |
| 인증 | JWT + 2FA/OTP | |
---
## 디렉토리 구조
```
C:\GUARDiA\
├── itsm/ # FastAPI 백엔드
│ ├── main.py # FastAPI 앱 진입점
│ ├── models.py # SQLAlchemy 모델
│ ├── auth.py # JWT 인증
│ ├── database.py # DB 연결
│ ├── core/ # 비즈니스 로직
│ │ ├── code_review.py # B-3: 코드 리뷰 엔진
│ │ ├── anomaly.py # B-1: 이상 탐지 엔진
│ │ └── notify.py # 알림 공통
│ ├── routers/ # API 라우터
│ └── .claude/ # 하네스 에이전트/스킬
├── projects/ # SM/SI 프로젝트 소스
│ ├── testcase-java-api/ # Spring Boot 테스트케이스
│ ├── testcase-py-api/ # FastAPI 테스트케이스
│ ├── testcase-js-frontend/ # HTML/JS 테스트케이스
│ └── testcase-php-legacy/ # PHP 레거시
└── docs/
```
---
## 보안 제약 (절대 불변)
1. **외부 API 완전 금지** — 모든 AI/LLM 호출은 내부 sLLM only (Ollama localhost:11434)
2. **서버 자격증명 노출 금지** — IP, 비밀번호, SSH 계정을 API 응답/메신저에 포함 금지
3. **AES-256-GCM 암호화** — tb_server.os_pw_enc 컬럼 필수 암호화
4. **root SSH 직접 접속 금지** — ssh_user != root 강제
5. **ServerOut 스키마 제외 필드** — ip_addr, ssh_user, os_pw_enc 절대 미포함
6. **스택트레이스 노출 금지** — 에러 응답은 SR ID + 요약 메시지만
7. **명령어 안전성 검증** — SSH 실행 전 위험 패턴 차단 (rm -rf /, mkfs, dd, shutdown 등)
8. **경로 순회 방지** — 첨부파일 경로 resolve().relative_to(UPLOAD_ROOT) 검증
---
## 30개 고도화 항목 진행 현황
| 코드 | 항목 | 상태 | 주요 파일 |
|------|------|------|-----------|
| A-1 | 알림 고도화 (WebSocket + 이메일) | ✅ DONE | routers/notify.py, core/notify.py |
| A-2 | 첨부 파일 관리 | ✅ DONE | routers/attachments.py |
| A-3 | 배포 승인 알림 (VibeSession 연동) | ✅ DONE | routers/vibe.py |
| A-4 | 운영 이벤트 타임라인 | ✅ DONE | routers/timeline.py |
| A-5 | 역할 기반 접근 제어 (RBAC) | ✅ DONE | auth.py, models.py |
| B-1 | AI 이상 탐지 (Anomaly Detection) | ✅ DONE | core/anomaly.py, routers/anomaly.py |
| B-2 | 자연어 SR 접수 챗봇 | ✅ DONE | core/chatbot.py, routers/chatbot.py |
| B-3 | 코드 리뷰 에이전트 (Ollama) | ✅ DONE | core/code_review.py, routers/code_review.py |
| B-4 | KB 자동 업데이트 에이전트 | ✅ DONE | core/kb_agent.py, routers/kb_agent.py |
| B-5 | 멀티 에이전트 협업 오케스트레이션 | ✅ DONE | core/orchestrator.py, routers/orchestrator.py |
| B-6 | 예측 유지보수 | ✅ DONE | core/predictive.py, routers/predictive.py |
| C-1 | CMDB (형상 관리 DB) | ✅ DONE | routers/cmdb.py (CI+관계+변경이력) |
| C-2 | 변경 관리 CAB | ✅ DONE | routers/change.py (RFC/CAB투표/동결기간) |
| C-3 | Problem Management | ✅ DONE | routers/problem.py (RCA/Known Error/PRB ID) |
| C-4 | 용량 관리 대시보드 | ✅ DONE | routers/capacity.py (예측/경보/확장시점) |
| C-5 | 서비스 카탈로그 | ✅ DONE | routers/catalog.py (SLA/SR자동생성/SVC ID) |
| D-1 | LDAP/AD 연동 | ✅ DONE | core/ldap_auth.py, routers/ldap.py (그룹→역할/env설정/동기화) |
| D-2 | 2FA / OTP | ✅ DONE | routers/otp.py |
| D-3 | 특권 접근 관리 (PAM) | ✅ DONE | routers/pam.py (세션발급/체크아웃/명령로깅/강제종료) |
| D-4 | 보안 취약점 자동 스캔 | ✅ DONE | core/vuln_scan.py, routers/vuln_scan.py (포트스캔/CVE/CVSS) |
| D-5 | 불변 감사 로그 (Hash Chain) | ✅ DONE | routers/audit.py (SHA-256체인/entity/IP해시/export) |
| E-1 | 월별 리포트 자동 생성 | ✅ DONE | routers/report.py |
| E-2 | 대시보드 분석 | ✅ DONE | routers/analytics.py |
| E-3 | SLA 대시보드 (실시간) | ✅ DONE | routers/sla.py |
| E-4 | Grafana 연동 (Prometheus) | ✅ DONE | routers/metrics.py |
| E-5 | FinOps 비용 분석 | ✅ DONE | routers/finops.py |
| F-1 | 멀티테넌트 데이터 격리 | ✅ DONE | middleware/tenant.py |
| F-2 | 모바일 반응형 UI | ✅ DONE | static/ |
| F-3 | 다국어 지원 (i18n) | ✅ DONE | core/i18n.py |
| F-4 | Mobile PWA | ✅ DONE | static/manifest.json |
| F-5 | OpenAPI 외부 연동 게이트웨이 | ✅ DONE | routers/gateway.py |
**완료: 30개 | 남은 항목: 0개 🎉**
---
## GUARDiA 하네스 구조 (.claude/)
### 에이전트 (agents/)
- **sr-manager.md**: SR 생성/조회/상태변경/담당자배정
- **code-reviewer.md**: B-3 코드 리뷰, quick-scan, findings 분석
- **deploy-engineer.md**: VibeSession 배포 파이프라인, Jenkins 연동
- **sla-guardian.md**: SLA 모니터링, 에스컬레이션
- **incident-responder.md**: 인시던트 생성, 온콜 호출, RCA
### 스킬 (skills/)
- **guardia-orchestrator/SKILL.md**: E2E SR→코드리뷰→배포 워크플로우
- **code-review/SKILL.md**: B-3 코드 리뷰 실행 가이드
- **sr-lifecycle/SKILL.md**: SR 상태 흐름, SLA 기준
- **deploy-pipeline/SKILL.md**: VibeSession 배포 단계 관리
---
## 핵심 구현 원칙
1. **에이전트리스**: 대상 서버에 어떤 소프트웨어도 설치하지 않는다.
2. **결정론적 파싱**: sLLM은 JSON만 출력한다. 자연어 부연 설명 금지.
3. **Fail-Safe**: 모든 배포는 백업→배포→헬스체크→롤백 시퀀스를 따른다.
4. **감사 추적**: 모든 명령과 결과는 TB_AUDIT_LOG에 기록한다.
5. **최소 권한**: 관제 전용 일반 계정(opsagent) 사용. root SSH 직접 접속 금지.
6. **보안 우선**: 서버 자격증명은 암호화 DB에만 저장. 메신저 응답에 노출 금지.
---
## 파일 작성 규칙
- **CLAUDE.md 수정 시**: 반드시 Python `open(encoding='utf-8')` 또는 Write 도구 사용
- PowerShell `Set-Content` / `Out-File` 절대 금지 (UTF-16 LE 오염 발생)
- **.xfdl.js 파일**: Nexacro 빌드 결과물 — 절대 수정/커밋 금지