sapientinc, 계층적 추론(Hierarchical Reasoning) 구조 채택한 언어 모델 'HRM-Text-1B' 공개
sapientinc가 계층적 추론(Hierarchical Reasoning) 구조를 도입한 새로운 언어 모델 HRM-Text-1B를 공개했습니다. 기존 autoregressive 방식과 달리 prefix-LM 아키텍처를 채택해 다층적인 추론 단계를 명시적으로 처리하는 것이 특징입니다. 1B 파라미터의 비교적 작은 모델임에도 불구하고 공개 직후 9만 회 이상 다운로드되어 연구자들의 뜨거운 관심을 받았습니다. 이 모델은 instruction tuning 없이 사전 학습(pre-alignment) 단계에서의 순수한 추론 성능을 검증하는 non-chat, non-instruction-tuned 형태로 제공됩니다. 관련 논문은 arXiv:2605.20613에 게재되어 있으며, HRM 아키텍처의 효과를 실증적으로 뒷받침하고 있습니다. Apache-2.0 라이선스로 공개되어 추론 능력 향상을 연구하는 ML 엔지니어라면 주목할 만한 모델입니다.