๐ ๊ฒ์
"llm-serving" ๊ฒ์ ๊ฒฐ๊ณผ 1๊ฑด
-
vLLM: ๊ณ ์ฒ๋ฆฌ๋, ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ ์ธ LLM ์ถ๋ก ๋ฐ ์๋น ์์ง
vLLM ํ๋ก์ ํธ๊ฐ 78,000๊ฐ ์ด์์ GitHub ์คํ๋ฅผ ๊ธฐ๋กํ๋ฉฐ LLM ์ถ๋ก ๋ฐ ์๋น ๋ถ์ผ์์ ๊ฐ์ฅ ์ธ๊ธฐ ์๋ ์คํ์์ค ์๋ฃจ์ ์ผ๋ก ์๋ฆฌ์ก์์ต๋๋ค. ์ด ํ๋ก์ ํธ๋ DeepSeek, Qwen, Kimi ๋ฑ ๋ค์ํ ์ต์ ๋ชจ๋ธ์ ์ง์ํ๋ฉฐ, AMD, NVIDIA, TPU ๋ฑ ๋ค์ํ ํ๋์จ์ด์ ์ต์ ํ๋์ด ์์ต๋๋ค. vLLM์ ๊ฐ๋ฐ์๋ค์ด ๋๊ท๋ชจ LLM์ ํจ์จ์ ์ผ๋กโฆ