운영자 · SI · DGX-SPARK(GB10)

DGX-SPARK에 풀스택 한 줄 설치

새 DGX-SPARK(GB10) 머신에 KAIDA 어플라이언스를 한 줄로 설치합니다. 완료되면 LLM·자동완성·데브포탈·GitLab이 모두 자동 기동됩니다.

사전 조건

설치 (한 줄)

1
새 DGX-SPARK(GB10)에서 root로 실행:
curl -fsSL https://developer.kopens.ai/gb10-setup.sh | sudo bash
Docker·NVIDIA Container Toolkit 설치 → 어플라이언스 번들 다운로드 → 어플라이언스별 시크릿 자동 생성 → docker compose up → 모델 자동 다운로드.
첫 기동은 모델 로딩·GitLab 초기화로 수 분~십수 분 걸립니다.

설치되는 구성

서비스역할포트
devportal설치·매뉴얼 포털80
litellmLLM 게이트웨이 (OpenAI/Anthropic 호환) + 관리 UI4000
onyx전사 코드·지식 검색 + 웹챗 (비개발자)3002
vllm채팅/에이전트 모델 (gpt-4o · 256K 컨텍스트)8000
vllm-fim인라인 자동완성 (code-completion)내부
gitlab소스관리 + CI8929 (ssh 2289)
gitlab-runnerCI 실행기
grafana모니터링 대시보드 (GPU·LLM·사용량)3001
prometheus · dcgm메트릭 수집 · GPU exporter내부

설치 후 접속

항목URL
데브포탈http://<서버-IP>/
LLM APIhttp://<서버-IP>:4000/v1
LiteLLM 관리 UIhttp://<서버-IP>:4000/ui (admin)
GitLabhttp://<서버-IP>:8929 (root)
Grafana 모니터링http://<서버-IP>:3001 (admin)
Onyx 웹챗http://<서버-IP>:3002
생성된 시크릿(마스터키, UI/GitLab root 비밀번호)은 /opt/kopens-ai/.env에 저장됩니다. 안전하게 보관하세요.

프로젝트 시작하기 (설치 후)

설치가 끝나면 아래 3단계로 팀이 바로 개발을 시작합니다 — 빠르면 당일.

순서: ① 개발자별 가상키 발급 (LiteLLM) → ② GitLab 프로젝트 생성 → ③ 개발자 PC 온보딩. 각 단계는 아래에 순서대로 정리되어 있습니다.

① 개발자 가상키 발급 (LiteLLM)

1
관리 UI 접속: http://<서버-IP>:4000/uiadmin / UI_PASSWORD (/opt/kopens-ai/.env)
2
Virtual Keys → + Create New Key — 개발자마다 1개씩 발급합니다.
3
설정: 허용 모델 gpt-4o·code-completion, Max Budget / RPM·TPM, 메타데이터에 이름·사번(사용량 귀속·생산성 모니터링용).
4
생성된 키(sk-…)를 해당 개발자에게 전달. 개발 PC 설치 시 입력합니다.
마스터키는 운영자 전용입니다. 개발자에게 공유하지 말고 항상 개인 가상키를 발급하세요 — 퇴사 시 해당 키만 폐기하면 됩니다.

② GitLab 프로젝트 생성

1
GitLab 접속: http://<서버-IP>:8929root / GITLAB_ROOT_PASSWORD (.env)
2
그룹(팀) 생성 — 예: dev-team. 개발자 계정 생성·초대(역할 부여).
3
New Project — 예: 이름 demo-app (빈 저장소 또는 import). 개발자에게 Developer / Maintainer 권한 부여. → 경로 dev-team/demo-app
4
(CI 사용 시) Settings → CI/CD → Runners에서 gitlab-runner 등록 확인.
5
표준 프로젝트 템플릿 등록(1회)gitlab-template/(Spring Boot 3.5 + PostgreSQL 17 + Maven 스켈레톤 + DevSecOps CI + AI 리뷰 + 룰)을 GitLab Custom Project Template로 등록. 이후 개발자는 New Project → Create from template → kaida-standard로 바로 시작. (절차: gitlab-template/SETUP.md)

③ 개발자 온보딩

1
개발 PC 사전 세팅(회사 인터넷) — 설치 스크립트는 developer.kopens.ai에서 받습니다(회사망 인터넷). 게이트웨이 주소·개인 키는 실행 시 프롬프트로 입력(가장 간편):
curl -fsSL https://developer.kopens.ai/install.sh | bash
실행하면 어플라이언스 게이트웨이 주소(예: http://<고객사-IP>:4000)개인 키를 물어봅니다. Windows: irm https://developer.kopens.ai/install.ps1 | iex
2
무인 설치(다수 PC 자동화) — 주소·키를 env로 주입:
curl -fsSL https://developer.kopens.ai/install.sh | KAIDA_LLM_BASE=http://<고객사-IP>:4000 KAIDA_LLM_KEY=sk-개인키 bash
3
IntelliJ에 Continue 플러그인 설치 → 자동완성·채팅 사용. 자세히는 개발자 가이드.
4
개발자가 프로젝트를 클론 → 코딩 시작. 예:
git clone http://<서버-IP>:8929/dev-team/demo-app.git
채팅·자동완성·에이전트·소스관리 모두 사내에서 완결됩니다.
사전 세팅 시 KAIDA_OPENCODE_VER·KAIDA_CLAUDE_VER버전을 고정하면 현장(폐쇄망)에서 일관됩니다.

운영 명령

cd /opt/kopens-ai
docker compose ps              # 상태
docker compose logs -f vllm    # 모델 로딩 로그
docker compose restart litellm # 재시작
docker compose down            # 정지