엔지니어링

비전-언어 모델 안전성 판단의 함정: 안전한 장면을 위험한 장면으로 판단하는 이유
By 최다솔, 송영숙비전-언어 모델은 실제 위험을 비교적 잘 탐지하지만, 안전한 장면도 위험으로 오판하는 과잉 반응을 자주 보였습니다. 이 블로그에서는 VERI 벤치마크를 통해 시각적으로 비슷하지만 의미가 다른 응급/안전 장면을 통해 이 한계를 측정한 결과를 공유합니다.18 June 2026

Agent 코딩과 긴 컨텍스트: VAST Data와 Backend.AI에서 KV 캐시 오프로딩이 실제로 주는 효과
By 허진호 외 2인래블업과 VAST Data가 공동으로 수행한 벤치마크는 KV 캐시 오프로딩이 에이전트 코딩 환경에서 TTFT를 최대 3.3배 개선하고 전체 지연을 절반 수준으로 줄알 수 있다는 점을 보여줍니다.16 June 2026

Intel Arc와 Backend.AI의 만남: Arc Pro B70의 32GB 메모리가 에이전트형 AI에 제공하는 이점
By 허진호 외 2인Backend.AI는 Intel Gaudi 2/3에 이어 Arc Pro B70까지 공식 지원합니다. 데이터센터부터 워크스테이션까지 Intel AI 하드웨어를 하나의 플랫폼에서 통합 관리할 수 있습니다.12 June 2026

GPU 클러스터를 위한 eBPF 보안 감사
By 조규진, 허진호GPU 학습 클러스터의 성능을 유지하면서 보안 감사를 구현하는 방법, eBPF를 소개합니다. 커널 내부에서 이벤트를 직접 처리하는 eBPF의 원리와 감사 적용 사례, 그리고 보안 주의사항을 다룹니다.27 May 2026

LLM 서빙에서 GPU 메모리를 아끼는 방법: KV 캐시 오프로딩 (KV cache offloading)의 원리와 작동 조건
By 조규진, 허진호Agentic AI 워크로드에서 GPU 메모리를 빠르게 잠식하는 KV 캐시(KV cache), 외부 저장소로 오프로딩하면 성능이 어떻게 달라질까요? KV cache offloading의 구조와 동작 원리, 효과적인 조건을 살펴봅니다.27 April 2026

프로덕션 RAG 시스템 구축기: 관세 분류와 기술지원에서 배운 것들
By Sergey Leksikov래블업 리서치팀이 1년간 구축한 두 프로덕션 RAG 시스템(관세 분류 HSense, Backend.AI 어시스턴트)의 설계와 실패 사례, 그리고 검색 품질이 모델 선택보다 중요한 이유를 공유합니다.23 April 2026

50개 컴포넌트에 이야기를 붙이기까지: 기반, 자동화 그리고 AI
By 임승현Backend.AI WebUI의 50개 넘는 BAI 컴포넌트에 Storybook 스토리를 붙인 과정을 정리했습니다. 1,000줄 가이드라인과 Claude 기반 자동 생성, GitHub Actions CI를 엮은 자동화 파이프라인을 다룹니다.5 March 2026

500+개 GPU의 심장 소리 듣기: 대규모 학습 클러스터 모니터링
By 이한정래블업이 B200 GPU 500대 이상 규모 클러스터에서 Solar Open 102B 사전학습을 지원하며 구축한 선제적 장애 탐지 시스템을 소개합니다. 데이터 수집 방법과 실제 이상 신호 사례를 공개합니다.20 February 2026

NVIDIA DGX Spark 들여다보기: DGX Spark는 정말 블랙웰 기반일까요?
By 신정규, 조규진NVIDIA DGX Spark가 1 PFLOP GB10 성능을 데스크톱에 담았지만, SM12x 아키텍처 탓에 최신 LLM 커널과 호환성 틈이 있습니다. 데이터센터 Blackwell(SM100)과의 차이를 짚습니다.19 February 2026

Backend.AI Sokovan 오케스트레이터가 세션 스케줄링 문제를 해결한 방법
By 김혁진래블업 CoreDev 팀이 Backend.AI Sokovan 오케스트레이터의 세션 스케줄링을 어떻게 개선했는지 정리했습니다. 변화하는 AI 워크로드에 맞춰 더 효율적으로 동작하도록 다시 설계한 과정입니다.8 December 2025

AAA: Agentic, Autonomous, Adaptive Intelligence - lab | up >/ conf/5 키노트
By 신정규창립 10주년 컨퍼런스 lab | up > /conf/5 키노트를 정리했습니다. 'Make AI Accessible'과 'Make AI Scalable'을 넘어, 지능을 정량 측정하고 낮은 가격에 공급하는 '지능 공급 기업'으로의 비전을 담았습니다.2 December 2025

에이전트 시대를 위한 여정: LLM 범용성 확보를 위한 MCP 사이드카 모델 학습
By 이준범오픈소스 LLM이 MCP(Model Context Protocol)를 제대로 지원하지 못하는 문제를 풀기 위한 접근을 소개합니다. 지도학습 실패에서 강화학습으로 전환하고 128K 토큰 처리와 JSON 파싱을 해결한 과정을 담았습니다.12 November 2025