주요 이야기

GPU 클러스터를 위한 eBPF 보안 감사
By 조규진, 허진호GPU 학습 클러스터의 성능을 유지하면서 보안 감사를 구현하는 방법, eBPF를 소개합니다. 커널 내부에서 이벤트를 직접 처리하는 eBPF의 원리와 감사 적용 사례, 그리고 보안 주의사항을 다룹니다.27 May 2026

LLM 서빙에서 GPU 메모리를 아끼는 방법: KV cache offloading의 원리와 작동 조건
By 조규진, 허진호Agentic AI 워크로드에서 GPU 메모리를 빠르게 잠식하는 KV cache, 외부 저장소로 오프로딩하면 성능이 어떻게 달라질까요? KV cache offloading의 구조와 동작 원리, 효과적인 조건을 살펴봅니다.27 April 2026

프로덕션 RAG 시스템 구축기: 관세 분류와 기술지원에서 배운 것들
By Sergey Leksikov래블업 리서치팀이 1년간 구축한 두 프로덕션 RAG 시스템(관세 분류 HSense, Backend.AI 어시스턴트)의 설계와 실패 사례, 그리고 검색 품질이 모델 선택보다 중요한 이유를 공유합니다.23 April 2026
소식

래블업의 AI EXPO KOREA 2026 하이라이트
By 래블업 주식회사래블업이 AI EXPO KOREA 2026을 마쳤습니다. Backend.AI의 AI 인프라 오케스트레이션 시연부터 노트북에서 AI 모델과 자율 에이전트를 돌리는 AI:GO까지, 3일의 부스 기록을 정리했습니다.15 May 2026

래블업, Python Software Foundation (PSF) Participating Sponsor로 합류
By 래블업 주식회사래블업이 Python Software Foundation(PSF)의 Participating Sponsor로 합류했습니다. 오픈소스 생태계에 대한 기여를 이어갑니다.13 February 2026

처음 걸어가는 길, 함께 만든 성과 - 래블업x업스테이지, 독자 AI 파운데이션 모델 1차수 평가 통과 비하인드
By 래블업 주식회사업스테이지 컨소시엄이 정부 '독자 AI 파운데이션 모델' 사업 1차 평가를 통과했습니다. 인프라 파트너 래블업과 함께한 1차 여정의 비하인드를 실무진 인터뷰로 풀었습니다.6 February 2026
출시

래블업, 애플 실리콘 특화 AI 추론 엔진 'mlxcel' 오픈소스 공개
By 래블업 주식회사래블업이 애플 실리콘(M1~M5)과 NVIDIA CUDA에 최적화한 AI 추론 엔진 mlxcel을 오픈소스로 공개합니다. 순수 Rust로 Python 런타임 없이 동작하며, mlx-lm 대비 평균 119% 디코딩 속도와 80개 이상 모델 아키텍처를 지원합니다.18 May 2026

Backend.AI FastTrack 3 25.18 업데이트 소식
By 래블업 주식회사Backend.AI FastTrack 3 25.18의 주요 변경 사항을 정리했습니다.5 January 2026

Backend.AI 25.15 (LTS) 업데이트 소식
By 래블업 주식회사2025년 하반기 장기 지원(LTS) 버전 Backend.AI 25.15가 출시됐습니다. 사용자 경험과 시스템 성능을 폭넓게 최적화해 대규모 AI 모델 학습·배포의 안정성을 높였습니다.2 October 2025
엔지니어링

GPU 클러스터를 위한 eBPF 보안 감사
By 조규진, 허진호GPU 학습 클러스터의 성능을 유지하면서 보안 감사를 구현하는 방법, eBPF를 소개합니다. 커널 내부에서 이벤트를 직접 처리하는 eBPF의 원리와 감사 적용 사례, 그리고 보안 주의사항을 다룹니다.27 May 2026

LLM 서빙에서 GPU 메모리를 아끼는 방법: KV cache offloading의 원리와 작동 조건
By 조규진, 허진호Agentic AI 워크로드에서 GPU 메모리를 빠르게 잠식하는 KV cache, 외부 저장소로 오프로딩하면 성능이 어떻게 달라질까요? KV cache offloading의 구조와 동작 원리, 효과적인 조건을 살펴봅니다.27 April 2026

프로덕션 RAG 시스템 구축기: 관세 분류와 기술지원에서 배운 것들
By Sergey Leksikov래블업 리서치팀이 1년간 구축한 두 프로덕션 RAG 시스템(관세 분류 HSense, Backend.AI 어시스턴트)의 설계와 실패 사례, 그리고 검색 품질이 모델 선택보다 중요한 이유를 공유합니다.23 April 2026