๐ ๊ฒ์
"safetensors" ๊ฒ์ ๊ฒฐ๊ณผ 9๊ฑด
-
DeepSeek-V4-Pro, HuggingFace ํธ๋ ๋ฉ 1์ โ ๋ค์ด๋ก๋ 580๋ง ํ ๋ํ
DeepSeek์ ์ ํ๋๊ทธ์ญ ๋ชจ๋ธ DeepSeek-V4-Pro๊ฐ HuggingFace์์ ํธ๋ ๋ฉ 1์์ ์ค๋ฅด๋ฉฐ ํญ๋ฐ์ ์ธ ๊ด์ฌ์ ๋ฐ๊ณ ์์ต๋๋ค. ์ถ์ ์งํ ๋ค์ด๋ก๋ 580๋ง ํ, ์ข์์ 4,594๊ฐ๋ฅผ ๊ธฐ๋กํ๋ฉฐ ์ญ๋๊ธ ๋ฐ์์ ๋์ด๋ด๊ณ ์์ต๋๋ค. MIT ๋ผ์ด์ ์ค๋ก ๊ณต๊ฐ๋์ด ์์ ์ ํ์ฉ์ด ์์ ๋กญ๊ณ , fp8 ์ ๋ฐ๋์ 8๋นํธ ์์ํ๋ฅผ ์ง์ํด ๋น๊ต์ ์ ์ VRAM์ผ๋กโฆ
-
DeepSeek-V4-Pro, HuggingFace ํธ๋ ๋ฉ 1์ โ ๋ค์ด๋ก๋ 580๋ง ๊ฑด ๋ํ
DeepSeek AI๊ฐ ๊ณต๊ฐํ DeepSeek-V4-Pro๊ฐ HuggingFace ํธ๋ ๋ฉ ์ต์์์ ์ค๋ฅด๋ฉฐ ํญ๋ฐ์ ์ธ ๊ด์ฌ์ ๋ฐ๊ณ ์์ต๋๋ค. ๊ณต๊ฐ ์ดํ ๋ค์ด๋ก๋ ์๊ฐ 580๋ง ๊ฑด์ ๋์ด์ฐ๊ณ ์ข์์๋ 4,493๊ฐ์ ๋ฌํด ํ์ฌ ์ปค๋ฎค๋ํฐ์์ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ๋ ํ ์คํธ ์์ฑ ๋ชจ๋ธ ์ค ํ๋๋ก ์๋ฆฌ ์ก์์ต๋๋ค. fp8 ๋ฐ 8-bit ์ถ๋ก ์ ์ง์ํด ์๋์ ์ผ๋ก ๊ฐ๋ฒผ์ด ํ๋์จ์ด์์โฆ
-
DeepSeek-V4-Pro ๊ณต๊ฐ ์ฆ์ HuggingFace ํธ๋ ๋ฉ 1์ โ 590๋ง ๋ค์ด๋ก๋ ๋ํ
DeepSeek๊ฐ ์ต์ ๋ชจ๋ธ DeepSeek-V4-Pro๋ฅผ HuggingFace์ ๊ณต๊ฐํ์๋ง์ ๋ค์ด๋ก๋ ์ 590๋ง ํ, ์ข์์ 4,400๊ฐ ์ด์์ ๊ธฐ๋กํ๋ฉฐ ํญ๋ฐ์ ์ธ ๋ฐ์์ ์ป๊ณ ์์ต๋๋ค. MIT ๋ผ์ด์ ์ค๋ก ๊ณต๊ฐ๋์ด ์์ ์ ํ์ฉ๋ ์์ ๋กญ๊ฒ ๊ฐ๋ฅํ๋ค๋ ์ ์ด ํนํ ์ฃผ๋ชฉ๋ฐ๊ณ ์์ต๋๋ค. 8-bit ๋ฐ fp8 ์์ํ๋ฅผ ์ง์ํด ๋ค์ํ ํ๋์จ์ด ํ๊ฒฝ์์๋ ์ ์ฐํ๊ฒ ์ฌ์ฉโฆ
-
Tencent, ํ๊ตญ์ด ํฌํจ 40๊ฐ ์ธ์ด ์ง์ ๋ฒ์ญ ํนํ LLM 'Hy-MT2' ์๋ฆฌ์ฆ ๊ณต๊ฐ
ํ ์ผํธ๊ฐ 40๊ฐ ์ด์์ ์ธ์ด๋ฅผ ์ง์ํ๋ ๋ฒ์ญ ํนํ LLM ์๋ฆฌ์ฆ Hy-MT2๋ฅผ HuggingFace์ ๊ณต๊ฐํ์ต๋๋ค. 1.8B ํ๋ผ๋ฏธํฐ์ ๊ฒฝ๋ dense ๋ชจ๋ธ(Hy-MT2-1.8B)๊ณผ 30B-A3B ๊ท๋ชจ์ ๋ํ ๋ชจ๋ธ(Hy-MT2-30B-A3B) ๋ ๊ฐ์ง ๋ฒ์ ์ผ๋ก ์ถ์๋์์ต๋๋ค. ํ๊ตญ์ด(ko)๋ฅผ ํฌํจํด ์์ด, ์ค๊ตญ์ด, ์ผ๋ณธ์ด, ์๋์ด, ํ๋์ด ๋ฑ ์ฃผ์ ์ธ์ด๋ฅผ โฆ
-
sapientinc, ๊ณ์ธต์ ์ถ๋ก (Hierarchical Reasoning) ๊ตฌ์กฐ ์ฑํํ ์ธ์ด ๋ชจ๋ธ 'HRM-Text-1B' ๊ณต๊ฐ
sapientinc๊ฐ ๊ณ์ธต์ ์ถ๋ก (Hierarchical Reasoning) ๊ตฌ์กฐ๋ฅผ ๋์ ํ ์๋ก์ด ์ธ์ด ๋ชจ๋ธ HRM-Text-1B๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ์กด autoregressive ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ prefix-LM ์ํคํ ์ฒ๋ฅผ ์ฑํํด ๋ค์ธต์ ์ธ ์ถ๋ก ๋จ๊ณ๋ฅผ ๋ช ์์ ์ผ๋ก ์ฒ๋ฆฌํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค. 1B ํ๋ผ๋ฏธํฐ์ ๋น๊ต์ ์์ ๋ชจ๋ธ์์๋ ๋ถ๊ตฌํ๊ณ ๊ณต๊ฐ ์งํ 9๋ง ํ ์ด์โฆ
-
ByteDance, ์ด๋ฏธ์งยท์์ ์์ฑยทํธ์งยท์ดํด ํตํฉ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ 'Lance' ๊ณต๊ฐ
๋ฐ์ดํธ๋์ค ๋ฆฌ์์นํ์ด ์ด๋ฏธ์ง ์์ฑ, ์์ ์์ฑ, ์ด๋ฏธ์ง ํธ์ง, ์์ ์ดํด๋ฅผ ํ๋์ ๋ชจ๋ธ๋ก ์ฒ๋ฆฌํ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ Lance๋ฅผ HuggingFace์ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ๋ฐ ๋ชจ๋ธ๋ก Qwen2.5-VL-3B-Instruct๋ฅผ ํ์ฉํ๋ฉฐ, any-to-any ํ์ดํ๋ผ์ธ์ ํตํด ํ ์คํธยท์ด๋ฏธ์งยท์์์ ์์ ๋กญ๊ฒ ์ ์ถ๋ ฅํ ์ ์๋ค๋ ์ ์ด ํต์ฌ์ ๋๋ค. ๊ธฐ์กด์๋ ์ด๋ฏธ์ง ์์ฑ, โฆ
-
OpenBMB, ์จ๋๋ฐ์ด์ค ๊ฒฝ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ MiniCPM-V-4.6 ์ถ์
OpenBMB๊ฐ ์ด๋ฏธ์ง์ ํ ์คํธ๋ฅผ ๋์์ ์ฒ๋ฆฌํ๋ ๊ฒฝ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ MiniCPM-V ์๋ฆฌ์ฆ์ ์ต์ ๋ฒ์ ์ธ MiniCPM-V-4.6์ ๊ณต๊ฐํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ์จ๋๋ฐ์ด์ค(On-Device) ํ๊ฒฝ์์์ ์คํ์ ๋ชฉํ๋ก ์ค๊ณ๋ lightweight ๋ชจ๋ธ๋ก, ์ค๋งํธํฐ์ด๋ ์ฃ์ง ๋๋ฐ์ด์ค์ฒ๋ผ ๋ฆฌ์์ค๊ฐ ์ ํ๋ ํ๊ฒฝ์์๋ ๋ฉํฐ๋ชจ๋ฌ AI๋ฅผ ํ์ฉํ ์ ์๋๋ก ์ต์ ํ๋์ด ์โฆ
-
DeepSeek-V4-Pro, HuggingFace ํธ๋ ๋ฉ 1์ ๋ฑ๊ทน
์ค๊ตญ AI ์คํํธ์ DeepSeek๊ฐ ์ ์ ๋ํ ์ธ์ด ๋ชจ๋ธ DeepSeek-V4-Pro๋ฅผ HuggingFace์ ๊ณต๊ฐํ๋ฉฐ ํธ๋ ๋ฉ 1์๋ฅผ ์ฐจ์งํ์ต๋๋ค. ๋์ ๋ค์ด๋ก๋ 276๋ง ํ ์ด์, ์ข์์ 3,972๊ฐ๋ฅผ ๊ธฐ๋กํ๋ฉฐ ์ปค๋ฎค๋ํฐ์ ํญ๋ฐ์ ์ธ ๊ด์ฌ์ ๋ฐ๊ณ ์์ต๋๋ค. MIT ๋ผ์ด์ ์ค๋ก ๊ณต๊ฐ๋์ด ์์ ์ ํ์ฉ์ด ์์ ๋กญ๊ณ , FP8 ๋ฐ 8-bit ์์ํ๋ฅผ ์ง์ํด ๋น๊ต์ ์ ์โฆ
-
Qwen3.6 ๋ํ ์ธ์ด ๋ชจ๋ธ์ด HuggingFace์์ ์ธ๊ธฐ ํญ๋ฐ
HuggingFace์ ์ต์ ํธ๋ ๋ฉ ๋ชจ๋ธ ๋ชฉ๋ก์ Qwen ์๋ฆฌ์ฆ๋ก ์ ๋ น๋์์ต๋๋ค. ํนํ Qwen3.6-35B-A3B๋ 182๋ง ๋ค์ด๋ก๋๋ฅผ ๊ธฐ๋กํ๋ฉฐ ๊ฐ์ฅ ์ธ๊ธฐ ์๋ ์คํ์์ค LLM์ ๋๋ค. ์ด ๋ชจ๋ธ๋ค์ Vision ๊ธฐ๋ฅ์ด ํตํฉ๋ multimodal ๋ชจ๋ธ๋ก, ์ด๋ฏธ์ง์ ํ ์คํธ๋ฅผ ํจ๊ป ์ฒ๋ฆฌํ ์ ์์ต๋๋ค. Unsloth์ GGUF ์์์ 553๋ง ๋ค์ด๋ก๋๋ฅผ ๊ธฐ๋กํ๋ฉฐโฆ