๐ ๊ฒ์
"license:apache-2.0" ๊ฒ์ ๊ฒฐ๊ณผ 4๊ฑด
-
ByteDance์ Lance, ์ด๋ฏธ์งยท์์ยทํ
์คํธ๋ฅผ ํ๋๋ก โ any-to-any ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ ๊ณต๊ฐ
ByteDance Research๊ฐ Lance๋ผ๋ any-to-any ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ HuggingFace์ ๊ณต๊ฐํ์ต๋๋ค. ์ด๋ฏธ์ง ์์ฑ, ๋น๋์ค ์์ฑ, ์ด๋ฏธ์ง ํธ์ง, ๋น๋์ค ์ดํด ๋ฑ ์๋ก ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ ์์ ์ ๋จ์ผ ๋ชจ๋ธ ํ๋๋ก ์ฒ๋ฆฌํ ์ ์๋ค๋ ์ ์ด ๊ฐ์ฅ ํฐ ํน์ง์ ๋๋ค. Qwen2.5-VL-3B-Instruct๋ฅผ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ก ํ์ฉํ์ผ๋ฉฐ, ๋ ผ๋ฌธ(arxiv:โฆ
-
Tencent, ํ๊ตญ์ด ํฌํจ 40๊ฐ ์ธ์ด ์ง์ ๋ฒ์ญ ํนํ LLM 'Hy-MT2' ์๋ฆฌ์ฆ ๊ณต๊ฐ
ํ ์ผํธ๊ฐ 40๊ฐ ์ด์์ ์ธ์ด๋ฅผ ์ง์ํ๋ ๋ฒ์ญ ํนํ LLM ์๋ฆฌ์ฆ Hy-MT2๋ฅผ HuggingFace์ ๊ณต๊ฐํ์ต๋๋ค. 1.8B ํ๋ผ๋ฏธํฐ์ ๊ฒฝ๋ dense ๋ชจ๋ธ(Hy-MT2-1.8B)๊ณผ 30B-A3B ๊ท๋ชจ์ ๋ํ ๋ชจ๋ธ(Hy-MT2-30B-A3B) ๋ ๊ฐ์ง ๋ฒ์ ์ผ๋ก ์ถ์๋์์ต๋๋ค. ํ๊ตญ์ด(ko)๋ฅผ ํฌํจํด ์์ด, ์ค๊ตญ์ด, ์ผ๋ณธ์ด, ์๋์ด, ํ๋์ด ๋ฑ ์ฃผ์ ์ธ์ด๋ฅผ โฆ
-
sapientinc, ๊ณ์ธต์ ์ถ๋ก (Hierarchical Reasoning) ๊ตฌ์กฐ ์ฑํํ ์ธ์ด ๋ชจ๋ธ 'HRM-Text-1B' ๊ณต๊ฐ
sapientinc๊ฐ ๊ณ์ธต์ ์ถ๋ก (Hierarchical Reasoning) ๊ตฌ์กฐ๋ฅผ ๋์ ํ ์๋ก์ด ์ธ์ด ๋ชจ๋ธ HRM-Text-1B๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ์กด autoregressive ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ prefix-LM ์ํคํ ์ฒ๋ฅผ ์ฑํํด ๋ค์ธต์ ์ธ ์ถ๋ก ๋จ๊ณ๋ฅผ ๋ช ์์ ์ผ๋ก ์ฒ๋ฆฌํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค. 1B ํ๋ผ๋ฏธํฐ์ ๋น๊ต์ ์์ ๋ชจ๋ธ์์๋ ๋ถ๊ตฌํ๊ณ ๊ณต๊ฐ ์งํ 9๋ง ํ ์ด์โฆ
-
ByteDance, ์ด๋ฏธ์งยท์์ ์์ฑยทํธ์งยท์ดํด ํตํฉ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ 'Lance' ๊ณต๊ฐ
๋ฐ์ดํธ๋์ค ๋ฆฌ์์นํ์ด ์ด๋ฏธ์ง ์์ฑ, ์์ ์์ฑ, ์ด๋ฏธ์ง ํธ์ง, ์์ ์ดํด๋ฅผ ํ๋์ ๋ชจ๋ธ๋ก ์ฒ๋ฆฌํ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ Lance๋ฅผ HuggingFace์ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ๋ฐ ๋ชจ๋ธ๋ก Qwen2.5-VL-3B-Instruct๋ฅผ ํ์ฉํ๋ฉฐ, any-to-any ํ์ดํ๋ผ์ธ์ ํตํด ํ ์คํธยท์ด๋ฏธ์งยท์์์ ์์ ๋กญ๊ฒ ์ ์ถ๋ ฅํ ์ ์๋ค๋ ์ ์ด ํต์ฌ์ ๋๋ค. ๊ธฐ์กด์๋ ์ด๋ฏธ์ง ์์ฑ, โฆ