ByteDance Research, 이미지·영상 생성·편집·이해를 하나로 처리하는 멀티모달 모델 Lance 공개
ByteDance Research가 이미지 생성, 영상 생성, 이미지 편집, 영상 이해를 단일 모델로 수행하는 any-to-any 멀티모달 모델 Lance를 HuggingFace에 공개했습니다. Lance는 Qwen/Qwen2.5-VL-3B-Instruct를 베이스 모델로 활용하며, ArXiv 논문(2605.18678)과 함께 공개되었습니다. 기존에는 이미지 생성, 영상 편집, 영상 이해 등의 작업을 별도 모델로 처리해야 했지만, Lance는 이를 하나의 모델 안에서 통합적으로 처리할 수 있다는 점이 가장 큰 특징입니다. 텍스트 입력만으로 이미지나 영상을 만들거나, 기존 이미지를 자연스럽게 편집하고, 영상 내용을 이해하는 것이 모두 가능합니다. 공개 직후 698개의 좋아요를 기록하며 HuggingFace 트렌딩에 오를 만큼 커뮤니티의 높은 관심을 받고 있습니다. Apache-2.0 라이선스로 공개되어 연구 및 상업적 용도 모두 자유롭게 활용할 수 있습니다.