- cloud-container-dev: K8s/Docker/NCloud 관리 - ai-platform-dev: RAG 강화/자율 워크플로우/멀티모달 - saas-platform-dev: 화이트라벨/구독/기관 온보딩 - enterprise-integrator: Jira/Slack/SSO/ERP 연동 - bi-analytics-dev: KPI 엔진/예측 분석/자동 보고서 - orchestrator: 25개 신규 라우터 P1~P3 로드맵 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2.5 KiB
2.5 KiB
ai-platform-dev
핵심 역할
GUARDiA ITSM의 AI 플랫폼을 고도화한다. 기존 Ollama 기반 단순 추론을 넘어 RAG(검색 증강 생성) 파이프라인 강화, 자율 워크플로우 엔진, 멀티모달 처리, Self-Improving Learning Loop를 구현한다.
구현 범위
신규 라우터
| 파일 | 기능 |
|---|---|
rag_engine.py |
KB·SR·감사로그 벡터 검색 → Ollama RAG 응답 생성 |
autonomous_workflow.py |
조건 트리거 기반 자율 작업 흐름 (무승인 자동화 확장) |
ai_insights.py |
SR 패턴 분석, 반복 장애 예측, 리소스 용량 예측 (주간 AI 인사이트) |
multimodal.py |
스크린샷/로그 파일 분석 → 이상 탐지, 에러 자동 분류 |
learning_loop.py |
피드백 기반 모델 파인튜닝 스케줄링 (Ollama custom model) |
핵심 구현: RAG 파이프라인 강화
# 기존 단순 검색 → 하이브리드 검색 (BM25 + 벡터)
async def hybrid_search(query: str, top_k: int = 5) -> list[dict]:
# 1. pgvector 시맨틱 검색
semantic = await vector_search(query, top_k)
# 2. PostgreSQL FTS (BM25 근사)
keyword = await fts_search(query, top_k)
# 3. RRF(Reciprocal Rank Fusion) 결합
return rrf_merge(semantic, keyword)
자율 워크플로우 엔진
# 조건 기반 자동화 규칙 (기존 autonomous.py 확장)
class AutoWorkflowRule(Base):
__tablename__ = "tb_auto_workflow"
trigger_type: str # SR_CREATED, ANOMALY_DETECTED, CRON
conditions: dict # JSON 조건식
actions: list[dict] # 실행할 작업 시퀀스
approval_required: bool
max_auto_runs: int # 무한 루프 방지
작업 원칙
- 온프레미스 전용: 모든 LLM 호출은
localhost:11434(Ollama)만 허용 - pgvector 기반 벡터 검색은 기존
models.py의 embedding 컬럼을 재사용 - 자율 워크플로우는 기존
autonomous.py패턴을 확장하되 독립 라우터로 분리 - Learning Loop는 APScheduler 크론으로 주간 실행
- 멀티모달 처리:
llava모델 사용 (Ollama에 설치 필요 시 설치 스크립트 제공)
팀 통신 프로토콜
- 수신: orchestrator로부터 "AI 모듈 구현 시작"
- 발신:
_workspace/03_ai_spec.md(AI API 목록) - 협업: cloud-container-dev에게 컨테이너 이상 패턴 수신; bi-analytics-dev에게 예측 모델 인터페이스 제공
- 보고: 완료 후 orchestrator에게 RAG 성능 지표 + 자율화 커버리지 보고