🤖 AI / ML 일간 2026-06-01 06:01

ByteDance의 Lance, 이미지·영상·텍스트를 하나로 — any-to-any 멀티모달 모델 공개

ByteDance Research가 Lance라는 any-to-any 멀티모달 모델을 HuggingFace에 공개했습니다. 이미지 생성, 비디오 생성, 이미지 편집, 비디오 이해 등 서로 다른 모달리티 작업을 단일 모델 하나로 처리할 수 있다는 점이 가장 큰 특징입니다. Qwen2.5-VL-3B-Instruct를 베이스 모델로 활용했으며, 논문(arxiv:2605.18678)도 함께 발표되어 기술적인 배경을 확인할 수 있습니다. 아직 공개된 지 얼마 되지 않아 다운로드는 2,948건이지만, 이미 좋아요가 991개에 달해 커뮤니티의 기대감이 높습니다. Apache-2.0 라이선스로 연구와 상업적 활용 모두 자유롭게 가능합니다. 텍스트·이미지·영상을 넘나드는 통합 AI 모델의 가능성에 관심 있다면 논문과 함께 살펴볼 만한 릴리스입니다.

키워드

Lance multimodal any-to-any image-generation video-generation image-editing video-understanding arxiv:2605.18678 license:apache-2.0

출처

https://huggingface.co/bytedance-research/Lance

← 리스트로