OpenBMB, 온디바이스 경량 멀티모달 모델 MiniCPM-V-4.6 출시
OpenBMB가 이미지와 텍스트를 동시에 처리하는 경량 멀티모달 모델 MiniCPM-V 시리즈의 최신 버전인 MiniCPM-V-4.6을 공개했습니다. 이 모델은 온디바이스(On-Device) 환경에서의 실행을 목표로 설계된 lightweight 모델로, 스마트폰이나 엣지 디바이스처럼 리소스가 제한된 환경에서도 멀티모달 AI를 활용할 수 있도록 최적화되어 있습니다. 클라우드 서버 없이 로컬에서 이미지를 이해하고 텍스트 응답을 생성하는 image-text-to-text 파이프라인을 지원합니다. HuggingFace에서 24만 7천 회 이상의 다운로드와 912개의 좋아요를 기록하며 큰 인기를 끌고 있습니다. SafeTensors 형식으로 제공되고 HuggingFace Inference Endpoints와 호환되어 배포도 편리합니다. Apache-2.0 라이선스로 공개되었으며, 복수의 ArXiv 논문(2604.27393, 2509.18154, 2408.01800, 2605.08985)이 함께 공개되어 기술적 배경을 자세히 확인할 수 있습니다.