엔지니어링

Backend.AI on DGX Spark: 오픈소스 버전 설치하기 튜토리얼
By 조규진 외 3인NVIDIA DGX Spark에서 Backend.AI 오픈소스 버전을 설치하고, 손쉽게 모델을 띄워 볼 수 있는 단계별 튜토리얼을 제공합니다.22 June 2026

다양한 AI 가속기의 시대: Backend.AI의 이기종 GPU 운영 전략
By 허진호AI 가속기 시장이 NVIDIA, AMD, Intel, 국산 NPU 등으로 다변화되며 이기종 GPU 혼합 운영이 현실화됐습니다. 벤더별 소프트웨어 스택 격차와 성능 차이로 운영이 까다롭지만, Backend.AI를 통해 리소스 그룹으로 분리하고 워크로드별 정책을 적용하면 각 가속기 강점을 온전히 활용할 수 있습니다.19 June 2026

비전-언어 모델 안전성 판단의 함정: 안전한 장면을 위험한 장면으로 판단하는 이유
By 최다솔, 송영숙비전-언어 모델은 실제 위험을 비교적 잘 탐지하지만, 안전한 장면도 위험으로 오판하는 과잉 반응을 자주 보였습니다. 이 블로그에서는 VERI 벤치마크를 통해 시각적으로 비슷하지만 의미가 다른 응급/안전 장면을 통해 이 한계를 측정한 결과를 공유합니다.18 June 2026

Agent 코딩과 긴 컨텍스트: VAST Data와 Backend.AI에서 KV 캐시 오프로딩이 실제로 주는 효과
By 허진호 외 2인래블업과 VAST Data가 공동으로 수행한 벤치마크는 KV 캐시 오프로딩이 에이전트 코딩 환경에서 TTFT를 최대 3.3배 개선하고 전체 지연을 절반 수준으로 줄알 수 있다는 점을 보여줍니다.16 June 2026

Intel Arc와 Backend.AI의 만남: Arc Pro B70의 32GB 메모리가 에이전트형 AI에 제공하는 이점
By 허진호 외 2인Backend.AI는 Intel Gaudi 2/3에 이어 Arc Pro B70까지 공식 지원합니다. 데이터센터부터 워크스테이션까지 Intel AI 하드웨어를 하나의 플랫폼에서 통합 관리할 수 있습니다.12 June 2026

GPU 클러스터를 위한 eBPF 보안 감사
By 조규진, 허진호GPU 학습 클러스터의 성능을 유지하면서 보안 감사를 구현하는 방법, eBPF를 소개합니다. 커널 내부에서 이벤트를 직접 처리하는 eBPF의 원리와 감사 적용 사례, 그리고 보안 주의사항을 다룹니다.27 May 2026

LLM 서빙에서 GPU 메모리를 아끼는 방법: KV 캐시 오프로딩 (KV cache offloading)의 원리와 작동 조건
By 조규진, 허진호Agentic AI 워크로드에서 GPU 메모리를 빠르게 잠식하는 KV 캐시(KV cache), 외부 저장소로 오프로딩하면 성능이 어떻게 달라질까요? KV cache offloading의 구조와 동작 원리, 효과적인 조건을 살펴봅니다.27 April 2026

프로덕션 RAG 시스템 구축기: 관세 분류와 기술지원에서 배운 것들
By Sergey Leksikov래블업 리서치팀이 1년간 구축한 두 프로덕션 RAG 시스템(관세 분류 HSense, Backend.AI 어시스턴트)의 설계와 실패 사례, 그리고 검색 품질이 모델 선택보다 중요한 이유를 공유합니다.23 April 2026

50개 컴포넌트에 이야기를 붙이기까지: 기반, 자동화 그리고 AI
By 임승현Backend.AI WebUI의 50개 넘는 BAI 컴포넌트에 Storybook 스토리를 붙인 과정을 정리했습니다. 1,000줄 가이드라인과 Claude 기반 자동 생성, GitHub Actions CI를 엮은 자동화 파이프라인을 다룹니다.5 March 2026

500+개 GPU의 심장 소리 듣기: 대규모 학습 클러스터 모니터링
By 이한정래블업이 B200 GPU 500대 이상 규모 클러스터에서 Solar Open 102B 사전학습을 지원하며 구축한 선제적 장애 탐지 시스템을 소개합니다. 데이터 수집 방법과 실제 이상 신호 사례를 공개합니다.20 February 2026

NVIDIA DGX Spark 들여다보기: DGX Spark는 정말 블랙웰 기반일까요?
By 신정규, 조규진NVIDIA DGX Spark가 1 PFLOP GB10 성능을 데스크톱에 담았지만, SM12x 아키텍처 탓에 최신 LLM 커널과 호환성 틈이 있습니다. 데이터센터 Blackwell(SM100)과의 차이를 짚습니다.19 February 2026

Backend.AI Sokovan 오케스트레이터가 세션 스케줄링 문제를 해결한 방법
By 김혁진래블업 CoreDev 팀이 Backend.AI Sokovan 오케스트레이터의 세션 스케줄링을 어떻게 개선했는지 정리했습니다. 변화하는 AI 워크로드에 맞춰 더 효율적으로 동작하도록 다시 설계한 과정입니다.8 December 2025