๐ ๊ฒ์
"endpoints_compatible" ๊ฒ์ ๊ฒฐ๊ณผ 4๊ฑด
-
DeepSeek-V4-Pro, HuggingFace ํธ๋ ๋ฉ 1์ โ ๋ค์ด๋ก๋ 580๋ง ํ ๋ํ
DeepSeek์ ์ ํ๋๊ทธ์ญ ๋ชจ๋ธ DeepSeek-V4-Pro๊ฐ HuggingFace์์ ํธ๋ ๋ฉ 1์์ ์ค๋ฅด๋ฉฐ ํญ๋ฐ์ ์ธ ๊ด์ฌ์ ๋ฐ๊ณ ์์ต๋๋ค. ์ถ์ ์งํ ๋ค์ด๋ก๋ 580๋ง ํ, ์ข์์ 4,594๊ฐ๋ฅผ ๊ธฐ๋กํ๋ฉฐ ์ญ๋๊ธ ๋ฐ์์ ๋์ด๋ด๊ณ ์์ต๋๋ค. MIT ๋ผ์ด์ ์ค๋ก ๊ณต๊ฐ๋์ด ์์ ์ ํ์ฉ์ด ์์ ๋กญ๊ณ , fp8 ์ ๋ฐ๋์ 8๋นํธ ์์ํ๋ฅผ ์ง์ํด ๋น๊ต์ ์ ์ VRAM์ผ๋กโฆ
-
DeepSeek-V4-Pro, HuggingFace ํธ๋ ๋ฉ 1์ โ ๋ค์ด๋ก๋ 580๋ง ๊ฑด ๋ํ
DeepSeek AI๊ฐ ๊ณต๊ฐํ DeepSeek-V4-Pro๊ฐ HuggingFace ํธ๋ ๋ฉ ์ต์์์ ์ค๋ฅด๋ฉฐ ํญ๋ฐ์ ์ธ ๊ด์ฌ์ ๋ฐ๊ณ ์์ต๋๋ค. ๊ณต๊ฐ ์ดํ ๋ค์ด๋ก๋ ์๊ฐ 580๋ง ๊ฑด์ ๋์ด์ฐ๊ณ ์ข์์๋ 4,493๊ฐ์ ๋ฌํด ํ์ฌ ์ปค๋ฎค๋ํฐ์์ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ๋ ํ ์คํธ ์์ฑ ๋ชจ๋ธ ์ค ํ๋๋ก ์๋ฆฌ ์ก์์ต๋๋ค. fp8 ๋ฐ 8-bit ์ถ๋ก ์ ์ง์ํด ์๋์ ์ผ๋ก ๊ฐ๋ฒผ์ด ํ๋์จ์ด์์โฆ
-
Tencent, ํ๊ตญ์ด ํฌํจ 40๊ฐ ์ธ์ด ์ง์ ๋ฒ์ญ ํนํ LLM 'Hy-MT2' ์๋ฆฌ์ฆ ๊ณต๊ฐ
ํ ์ผํธ๊ฐ 40๊ฐ ์ด์์ ์ธ์ด๋ฅผ ์ง์ํ๋ ๋ฒ์ญ ํนํ LLM ์๋ฆฌ์ฆ Hy-MT2๋ฅผ HuggingFace์ ๊ณต๊ฐํ์ต๋๋ค. 1.8B ํ๋ผ๋ฏธํฐ์ ๊ฒฝ๋ dense ๋ชจ๋ธ(Hy-MT2-1.8B)๊ณผ 30B-A3B ๊ท๋ชจ์ ๋ํ ๋ชจ๋ธ(Hy-MT2-30B-A3B) ๋ ๊ฐ์ง ๋ฒ์ ์ผ๋ก ์ถ์๋์์ต๋๋ค. ํ๊ตญ์ด(ko)๋ฅผ ํฌํจํด ์์ด, ์ค๊ตญ์ด, ์ผ๋ณธ์ด, ์๋์ด, ํ๋์ด ๋ฑ ์ฃผ์ ์ธ์ด๋ฅผ โฆ
-
sapientinc, ๊ณ์ธต์ ์ถ๋ก (Hierarchical Reasoning) ๊ตฌ์กฐ ์ฑํํ ์ธ์ด ๋ชจ๋ธ 'HRM-Text-1B' ๊ณต๊ฐ
sapientinc๊ฐ ๊ณ์ธต์ ์ถ๋ก (Hierarchical Reasoning) ๊ตฌ์กฐ๋ฅผ ๋์ ํ ์๋ก์ด ์ธ์ด ๋ชจ๋ธ HRM-Text-1B๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ์กด autoregressive ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ prefix-LM ์ํคํ ์ฒ๋ฅผ ์ฑํํด ๋ค์ธต์ ์ธ ์ถ๋ก ๋จ๊ณ๋ฅผ ๋ช ์์ ์ผ๋ก ์ฒ๋ฆฌํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค. 1B ํ๋ผ๋ฏธํฐ์ ๋น๊ต์ ์์ ๋ชจ๋ธ์์๋ ๋ถ๊ตฌํ๊ณ ๊ณต๊ฐ ์งํ 9๋ง ํ ์ด์โฆ