Backend.AI Blog - 엔지니어링

엔지니어링

우리는 정말 데이터가 부족할까?
By 조원익, 송영숙
"한국어는 자원이 부족한 언어"라는 말은 절반만 진실입니다. 데이터가 없는 것이 아니라, 흩어져 있고 닫혀 있으며 잘 알려지지 않았을 뿐입니다. 이 글은 Open Korean Corpora 보고서를 바탕으로 100개의 공개 한국어 말뭉치를 10개 분야로 정리하고, 문서화·이용·재배포 세 기준으로 그 현황을 분석합니다.
1 July 2026
- 가이드
- 리서치
자세히 읽기
Backend.AI on DGX Spark: 오픈소스 버전 설치하기 튜토리얼
By 조규진 외 3인
NVIDIA DGX Spark에서 Backend.AI 오픈소스 버전을 설치하고, 손쉽게 모델을 띄워 볼 수 있는 단계별 튜토리얼을 제공합니다.
22 June 2026
- 가이드
- Backend.AI
자세히 읽기
다양한 AI 가속기의 시대: Backend.AI의 이기종 GPU 운영 전략
By 허진호
AI 가속기 시장이 NVIDIA, AMD, Intel, 국산 NPU 등으로 다변화되며 이기종 GPU 혼합 운영이 현실화됐습니다. 벤더별 소프트웨어 스택 격차와 성능 차이로 운영이 까다롭지만, Backend.AI를 통해 리소스 그룹으로 분리하고 워크로드별 정책을 적용하면 각 가속기 강점을 온전히 활용할 수 있습니다.
19 June 2026
- 래블업
- Backend.AI
자세히 읽기
비전-언어 모델 안전성 판단의 함정: 안전한 장면을 위험한 장면으로 판단하는 이유
By 최다솔, 송영숙
비전-언어 모델은 실제 위험을 비교적 잘 탐지하지만, 안전한 장면도 위험으로 오판하는 과잉 반응을 자주 보였습니다. 이 블로그에서는 VERI 벤치마크를 통해 시각적으로 비슷하지만 의미가 다른 응급/안전 장면을 통해 이 한계를 측정한 결과를 공유합니다.
18 June 2026
자세히 읽기
Agent 코딩과 긴 컨텍스트: VAST Data와 Backend.AI에서 KV 캐시 오프로딩이 실제로 주는 효과
By 허진호 외 2인
래블업과 VAST Data가 공동으로 수행한 벤치마크는 KV 캐시 오프로딩이 에이전트 코딩 환경에서 TTFT를 최대 3.3배 개선하고 전체 지연을 절반 수준으로 줄알 수 있다는 점을 보여줍니다.
16 June 2026
- Backend.AI
- VAST Data
자세히 읽기
Intel Arc와 Backend.AI의 만남: Arc Pro B70의 32GB 메모리가 에이전트형 AI에 제공하는 이점
By 허진호 외 2인
Backend.AI는 Intel Gaudi 2/3에 이어 Arc Pro B70까지 공식 지원합니다. 데이터센터부터 워크스테이션까지 Intel AI 하드웨어를 하나의 플랫폼에서 통합 관리할 수 있습니다.
12 June 2026
자세히 읽기
GPU 클러스터를 위한 eBPF 보안 감사
By 조규진, 허진호
GPU 학습 클러스터의 성능을 유지하면서 보안 감사를 구현하는 방법, eBPF를 소개합니다. 커널 내부에서 이벤트를 직접 처리하는 eBPF의 원리와 감사 적용 사례, 그리고 보안 주의사항을 다룹니다.
27 May 2026
자세히 읽기
LLM 서빙에서 GPU 메모리를 아끼는 방법: KV 캐시 오프로딩 (KV cache offloading)의 원리와 작동 조건
By 조규진, 허진호
Agentic AI 워크로드에서 GPU 메모리를 빠르게 잠식하는 KV 캐시(KV cache), 외부 저장소로 오프로딩하면 성능이 어떻게 달라질까요? KV cache offloading의 구조와 동작 원리, 효과적인 조건을 살펴봅니다.
27 April 2026
- KV 캐시
- 인퍼런스
자세히 읽기
프로덕션 RAG 시스템 구축기: 관세 분류와 기술지원에서 배운 것들
By Sergey Leksikov
래블업 리서치팀이 1년간 구축한 두 프로덕션 RAG 시스템(관세 분류 HSense, Backend.AI 어시스턴트)의 설계와 실패 사례, 그리고 검색 품질이 모델 선택보다 중요한 이유를 공유합니다.
23 April 2026
- LLM
- RAG
자세히 읽기
50개 컴포넌트에 이야기를 붙이기까지: 기반, 자동화 그리고 AI
By 임승현
Backend.AI WebUI의 50개 넘는 BAI 컴포넌트에 Storybook 스토리를 붙인 과정을 정리했습니다. 1,000줄 가이드라인과 Claude 기반 자동 생성, GitHub Actions CI를 엮은 자동화 파이프라인을 다룹니다.
5 March 2026
- 인턴십
- 프론트엔드
자세히 읽기
500+개 GPU의 심장 소리 듣기: 대규모 학습 클러스터 모니터링
By 이한정
래블업이 B200 GPU 500대 이상 규모 클러스터에서 Solar Open 102B 사전학습을 지원하며 구축한 선제적 장애 탐지 시스템을 소개합니다. 데이터 수집 방법과 실제 이상 신호 사례를 공개합니다.
20 February 2026
- LLM
- 인턴십
자세히 읽기
NVIDIA DGX Spark 들여다보기: DGX Spark는 정말 블랙웰 기반일까요?
By 신정규, 조규진
NVIDIA DGX Spark가 1 PFLOP GB10 성능을 데스크톱에 담았지만, SM12x 아키텍처 탓에 최신 LLM 커널과 호환성 틈이 있습니다. 데이터센터 Blackwell(SM100)과의 차이를 짚습니다.
19 February 2026
- AI:GO
- 아키텍처
자세히 읽기

블로그

엔지니어링

개인정보를 소중히 여깁니다