최신 게임 프로그래밍 및 AI 기술 동향을 전해드립니다.

1. Mercury 2: 확산 기반 최속 추론 LLM 공개

Inception Labs 가 초당 1,009 토큰 생성 속도의 확산 기반 추론 LLM 을 발표했습니다. 기존 오토리그레이시브 디코딩을 넘어 병렬 리파인먼트 방식으로 5 배 이상 빠른 생성을 실현했습니다. 128K 컨텍스트, 튜너블 리즈닝, 네이티브 툴 사용을 지원하며 실시간 에이전트 워크플로우에 최적화되어 있습니다.

2. Moonshine: WhisperLargev3 초과 정확도의 오픈 STT 모델

Moonshine Voice 가 26MB 경량 모델부터 고정밀 모델까지 오픈소스 음성인식 툴킷을 공개했습니다. 온디바이스 실행으로 저지연 스트리밍에 최적화되었으며 한국어 포함 8 개 언어를 지원합니다. Whisper Large V3 보다 높은 정확도를 달성하며 파이썬, iOS, Android, 라즈베리파이 등 멀티플랫폼을 지원합니다.

3. PageIndex: 벡터 DB 없는 추론 기반 RAG 프레임워크

문서 트리 인덱스와 LLM 추론으로 벡터 검색 없이 인간형 검색을 구현하는 RAG 시스템입니다. 청킹과 벡터 DB 를 제거하고 문서 구조 기반 계층적 트리 인덱스로 98.7% FinanceBench 정확도를 달성했습니다. MCP 와 API 를 통해 통합 가능하며 전문가 문서 분석에 특화된 설명 가능한 검색을 제공합니다.

4. Hugging Face Skills: 코딩 에이전트 표준 스킬 포맷

허깅페이스가 Claude Code, Codex, Gemini CLI 호환 에이전트 스킬 표준 포맷을 공개했습니다. 데이터셋 생성, 모델 학습, 평가 등 AI/ML 태스크를 위한 자기완결형 스킬 정의를 제공합니다. 플러그인 마켓플레이스 방식으로 설치하며 모든 주요 코딩 에이전트 도구와 상호운용성을 보장합니다.

5. RuVector: Rust 기반 고성능 벡터·그래프 데이터베이스

HNSW 검색과 동적 최소 컷 응집도를 결합한 Rust 제 AI 에이전트용 실시간 분석 엔진입니다. 그래프 지능과 자기학습 메모리를 통합하여 확장 가능한 저지연 추론과 구조화된 검색을 지원합니다. 벡터와 그래프 DB 를 단일 엔진으로 통합하며 AI 에이전트 시스템과 실시간 분석 워크로드에 최적화되어 있습니다.