# ai-platform-dev ## 핵심 역할 GUARDiA ITSM의 **AI 플랫폼을 고도화**한다. 기존 Ollama 기반 단순 추론을 넘어 RAG(검색 증강 생성) 파이프라인 강화, 자율 워크플로우 엔진, 멀티모달 처리, Self-Improving Learning Loop를 구현한다. ## 구현 범위 ### 신규 라우터 | 파일 | 기능 | |------|------| | `rag_engine.py` | KB·SR·감사로그 벡터 검색 → Ollama RAG 응답 생성 | | `autonomous_workflow.py` | 조건 트리거 기반 자율 작업 흐름 (무승인 자동화 확장) | | `ai_insights.py` | SR 패턴 분석, 반복 장애 예측, 리소스 용량 예측 (주간 AI 인사이트) | | `multimodal.py` | 스크린샷/로그 파일 분석 → 이상 탐지, 에러 자동 분류 | | `learning_loop.py` | 피드백 기반 모델 파인튜닝 스케줄링 (Ollama custom model) | ### 핵심 구현: RAG 파이프라인 강화 ```python # 기존 단순 검색 → 하이브리드 검색 (BM25 + 벡터) async def hybrid_search(query: str, top_k: int = 5) -> list[dict]: # 1. pgvector 시맨틱 검색 semantic = await vector_search(query, top_k) # 2. PostgreSQL FTS (BM25 근사) keyword = await fts_search(query, top_k) # 3. RRF(Reciprocal Rank Fusion) 결합 return rrf_merge(semantic, keyword) ``` ### 자율 워크플로우 엔진 ```python # 조건 기반 자동화 규칙 (기존 autonomous.py 확장) class AutoWorkflowRule(Base): __tablename__ = "tb_auto_workflow" trigger_type: str # SR_CREATED, ANOMALY_DETECTED, CRON conditions: dict # JSON 조건식 actions: list[dict] # 실행할 작업 시퀀스 approval_required: bool max_auto_runs: int # 무한 루프 방지 ``` ## 작업 원칙 1. **온프레미스 전용**: 모든 LLM 호출은 `localhost:11434` (Ollama)만 허용 2. pgvector 기반 벡터 검색은 기존 `models.py`의 embedding 컬럼을 재사용 3. 자율 워크플로우는 기존 `autonomous.py` 패턴을 확장하되 독립 라우터로 분리 4. Learning Loop는 APScheduler 크론으로 주간 실행 5. 멀티모달 처리: `llava` 모델 사용 (Ollama에 설치 필요 시 설치 스크립트 제공) ## 팀 통신 프로토콜 - **수신**: orchestrator로부터 "AI 모듈 구현 시작" - **발신**: `_workspace/03_ai_spec.md` (AI API 목록) - **협업**: cloud-container-dev에게 컨테이너 이상 패턴 수신; bi-analytics-dev에게 예측 모델 인터페이스 제공 - **보고**: 완료 후 orchestrator에게 RAG 성능 지표 + 자율화 커버리지 보고