조직과 사용자에게 어떤 변화가 생기나요?

단순한 기술 도입이 아닙니다. 일하는 방식을 혁신하고 조직의 지식 자산을 보호합니다.

업무 생산성 극대화

자료 조사 시간을 90% 단축합니다. 하루 1시간 이상 걸리던 문서 탐색을 단 1번의 질문으로 해결하고, 본질적인 업무에 집중할 수 있습니다.

🧠

지식 자산의 영구화

퇴사자로 인해 유실되던 업무 노하우와 히스토리를 AI가 학습하여 보존합니다. 어느 누가 질문해도 숙련된 전문가 수준의 답변을 얻을 수 있습니다.

⚖️

정확한 의사결정 지원

"감이 아닌 데이터"에 기반한 의사결정을 돕습니다. 수많은 보고서와 통계 자료에서 연관된 팩트만을 추출하여 판단 근거로 제시합니다.

🤝

부서 간 사일로(Silo) 해소

다른 팀의 업무 문서를 찾기 위해 전화하고 메일을 보낼 필요가 없습니다. 권한이 허용된 모든 부서의 지식을 통합 검색하여 협업 장벽을 허뭅니다.

🔒

완벽한 보안 환경

외부 유출 걱정 제로. 인터넷이 차단된 사내망에서도 100% 동작하며, 회사의 기밀 문서는 그 어떤 외부 AI 서버로도 전송되지 않습니다.

🎓

교육 및 온보딩 혁신

두꺼운 매뉴얼을 외울 필요가 없습니다. 신입 사원은 AI 선임에게 언제든 편하게 물어보고 즉시 업무에 투입될 수 있습니다.

주요 기능 상세

🔍 질의 기능

🎯

하이브리드 검색 + 재순위화

pgvector 벡터 검색과 tsvector 키워드 검색을 RRF 알고리즘으로 결합하고 Cross-Encoder로 최종 순위를 조정

SSE 실시간 스트리밍

Server-Sent Events 기반 토큰 스트리밍으로 답변이 생성되는 즉시 화면에 표시 (체감 속도 50% 이상 개선)

📎

출처 인용 정보

응답과 함께 참조된 문서의 출처 정보를 제공

📊

Text-to-SQL 분석

"지난달 A부서 매출 얼마야?" 자연어 질문을 SQL로 자동 변환하여 DB에서 정확한 수치를 추출합니다.

📈

정형 데이터 시각화

DB 쿼리 결과를 단순 텍스트가 아닌 표와 그래프로 시각화하여 데이터 인사이트를 제공합니다.

🏷️

소스 필터링

특정 지식 영역만 선택하여 검색 범위 제한 가능

💬

동적 프롬프트

시스템 프롬프트를 실시간으로 변경하여 응답 스타일 조정

📥 인제스트 기능

소스 설명 처리 방식
hr_onboarding 인사 규정 및 온보딩 가이드 신규 입사자용 PDF/PPT 파일 텍스트 추출 → Q&A 생성
finance_policy 비용 집행 및 구매 규정 지출 결의서 및 규정집의 조항 단위 파싱 → 검색 최적화
rnd_reports 연구 논문 및 실험 보고서 전문 용어/수식 포함 문서의 PaddleOCR 기반 텍스트 추출 (한국어 93~95% 정확도)
it_helpdesk IT 장애 처리 매뉴얼 (FAQ) 장애 유형별(증상/원인/해결) 구조화된 데이터 파싱
biz_erp ERP/CRM 사용자 매뉴얼 시스템 화면 캡처 및 기능 설명 텍스트 매핑
safe_sop 현장 안전 및 표준 작업 절차(SOP) 작업 단계별 절차서의 순서 유지 및 체크리스트 추출

📊 운영 화면 (UI)

📈

상태 대시보드

API, OCR, PostgreSQL, Redis, Ollama, GPU 상태를 실시간으로 확인합니다.

⚙️

설정 패널

임베딩 모드 전환, 시스템 프롬프트 수정 등 설정을 관리합니다.

📋

인제스트 콘솔

소스별 작업 시작 및 진행 로그를 실시간으로 확인합니다.

📊

문서/청크 수

PostgreSQL에 저장된 전체 문서와 청크 수를 실시간으로 확인합니다.

🐳

컨테이너 매니저

• 컨테이너 상태/수량 실시간 모니터링 Online/Offline 모드 원클릭 전환 • 서비스 중지 및 헬스 체크 기능

🤖

AI 운영 에이전트 (Creative)

복잡한 명령어 대신 "지금 서버 상태 어때?"라고 물어보세요. AI 에이전트가 로그를 분석하고 장애 조치까지 제안하는 차세대 대화형 운영 환경입니다.

컨테이너 기반 운영 아키텍처

복잡한 설치 과정 없이 컨테이너 기술로 즉시 도입하고, 엔터프라이즈 환경으로 유연하게 확장합니다.

🐳

Docker 컨테이너 도입

신속한 초기 구축 및 간편한 운영
  • All-in-One 패키지 (Docker 6개 서비스)

    API, OCR, UI, DB, Cache, LLM 등 6개 컨테이너가 하나의 패키지로 제공되어 신속한 설치 완료

  • 표준화된 운영 환경

    개발, 테스트, 운영 서버 환경을 100% 동일하게 유지하여 환경 차이로 인한 장애 원천 차단

  • 독립된 실행 보장

    기존 레거시 시스템과 라이브러리 충돌 없이 독립적으로 안전하게 실행

☸️

Kubernetes 확장 (Enterprise)

대규모 트래픽 대응 및 무중단 운영
  • 트래픽 자동 대응 (Auto-scaling)

    사용자가 몰리는 시간대에는 자동으로 AI 추론 서버를 증설하여 안정적인 속도 유지

  • 무중단 업데이트

    서비스 중단 없이 새로운 문서 학습 데이터나 AI 모델 버전으로 실시간 교체 가능

  • 고가용성 (High Availability)

    특정 서버 장애 발생 시 자동으로 다른 서버로 요청을 우회하여 365일 24시간 서비스 보장

🚀 하이브리드 클라우드 & GPU 최적화 지원

NVIDIA Container Toolkit을 통한 GPU 가속을 기본 지원하며,
AWS EKS, Azure AKS, Google GKE 및 사내 프라이빗 클라우드(OpenShift 등) 환경에 완벽하게 호환됩니다.

운영 프로세스

도입 후 권장되는 운영 프로세스

📅

정기 인제스트

스케줄러 또는 CLI를 통해 주기적으로 지식베이스를 갱신합니다.

📊

헬스 모니터링

UI 대시보드에서 API, 데이터베이스, 모델 서버의 상태를 실시간으로 확인합니다.

💡

사용자 피드백 반영

실제 질의 결과에 대한 사용자 만족도를 분석하여 답변 품질을 지속적으로 개선합니다.

🔄

모델 고도화

최신 오픈소스 모델 업데이트 및 임베딩 최적화를 통해 시스템 성능을 향상시킵니다.

🔒

보안 및 권한 관리

부서별/직급별 문서 접근 권한을 정기적으로 점검하고 보안 감사 로그를 관리합니다.

🚀

성능 최적화 튜닝

검색 정확도와 응답 속도를 모니터링하여 RAG 파라미터 및 리소스를 최적화합니다.

빠른 PoC 실행

고객의 일부 문서만으로도 약 6시간 내에 빠른 PoC 환경 구축 및 기술 검증이 가능합니다.

1️⃣

.env 파일 설정

환경 변수 파일을 생성하고 기본 설정을 구성합니다.

2️⃣

Docker Compose 실행

docker compose up 명령으로 전체 서비스를 시작합니다.

3️⃣

UI 접속

http://localhost:8080/에서 UI를 확인합니다.

📁 귀사의 사내 문서 연동 경로
data/raw/WORK_Source/ - 소스 코드 파일 data/raw/WORK_DOC/ - 업무 문서 (PDF, DOCX, HWP, HWPX, Excel)
🔒 보안 구간 내 오프라인 운영
EMBED_MODEL_ALLOW_DOWNLOADS=0 INGEST_ALLOW_DOWNLOADS=0 • 로컬 모델 캐시 필요

RAG 시스템 도입을 검토 중이신가요?

사내 문서 기반 AI 답변 시스템 구축에 관심이 있으시다면 언제든지 문의해주세요. 상세한 기술 상담을 제공해드립니다.

이메일 문의하기 아키텍처 다시 보기