์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
- 1x1 Convolution
- bottleneck
- Two Pointer
- get_dummies()
- Inductive Bias
- mobilenet
- ์ฐ์ฐ๋ ๊ฐ์
- ์ ๊ทํ
- outer join
- BFS
- ๋ฐ์ดํฐ๋ชจ๋ธ๋ง
- depthwise convolution
- pytorch
- CROSS JOIN
- feature map
- ์ธ์ ๋ฆฌ์คํธ
- dp
- SQLD
- dfs
- resnet
- numpy
- ์ํฐํฐ
- ์๋ณ์
- ์ธ์ ํ๋ ฌ
- SQLD ํ๊ธฐ
- SQL
- ๊ทธ๋ํ
- ๋ฐฑ์ค
- Depthwise Separable Convolution
- skip connection
- Today
- Total
๋ชฉ๋ก2024/06/14 (2)
SJ_Koding
langchain์ LlamaCPP๋ฅผ ์ฌ์ฉํ๋ค๊ฐ. ํ ์คํธ๋ก vllm์ ์ฌ์ฉํ์ ๋ ํ์ 13GB์ ๋ ๋จน์๋ ์ ๊ฐ ๋๋ท์์ด 70GB๋ฅผ ๋๊ฒ ์ก์๋จน์๋ค.๋จผ์ VLLM(Very Large Language Models)์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ํจ์จ์ ์ธ ์ถ๋ก ์ ์ํด ์ค๊ณ๋ ์์คํ ์ด๋ค. ํนํ, VLLM์ ๋ชจ๋ธ ์ถ๋ก ์ค์ ๋ฐ๋ณต์ ์ผ๋ก ์ฐธ์กฐ๋๋ ๋ฐ์ดํฐ์ ์บ์ฑ์ ์ํด ํค-๊ฐ ์บ์(KV Cache)๋ฅผ ์ฌ์ฉํ๋ค. KV Cache๋ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ์ ๊ฐ ๋ ์ด์ด์์ ์์ฑ๋ ํค(Key)์ ๊ฐ(Value) ํ ์๋ฅผ ์ ์ฅํ์ฌ, ๋์ผํ ์ ๋ ฅ์ ๋ํด ๋ฐ๋ณต์ ์ธ ๊ณ์ฐ์ ํผํ๊ณ ์ฑ๋ฅ์ ์ต์ ํํ๋ค.KV Cache๋ ๋ค์๊ณผ ๊ฐ์ ์ฅ์ ์ ์ ๊ณตํ๋ค:์ถ๋ก ์๋ ํฅ์: ๋ฐ๋ณต๋๋ ๊ณ์ฐ์ ์ค์ฌ ์ถ๋ก ์๋๋ฅผ ํฌ๊ฒ ํฅ์์ํจ๋ค.๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ ์ต์ ํ: ์บ์ฑ์ ํตํด ํ์..

๊ฐ์๋ฌธ์์์ ํ ์คํธ๋ฅผ ์ถ์ถํ๋๊ฑด ๋ค์ํ๊ฒ ์ฐ์ผ ์ ์๋๋ฐ, LLM์ ๋์ ํ ๋ ๊ฝค ์ ์ฉํ๊ฒ ์ฐ์ผ ์ ์๋ค. ์ด๋ฅผํ ๋ฉด ์ฑ๋ด์ ๋ฌธ์๋ฅผ ์ ๋ก๋ํ๋ฉด ํด๋น ๋ฌธ์๋ฅผ ์์ฝํ ์ ์๋๋ก ํ ์ ์๋๋ฐ(๋ฌผ๋ก PNGํ์ผ๊ณผ ๊ฐ์ ์ด๋ฏธ์ง ํ์ผ์ OCR๊ธฐ์ ์ด ํ์ํ๋ค), ๊ทธ๋ฌ๊ธฐ ์ํด์๋ ๋ฌธ์ ๋ด์ ํ ์คํธ๋ฅผ ์ถ์ถํ์ฌ ํด๋น ๋ฐ์ดํฐ๋ฅผ LLM๋ชจ๋ธ์ ๋๊ฒจ์ค์ผํ๋ค. ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๋ฉด ์ถ๊ฐ ๊ฐ๊ณตํ๊ฑฐ๋ ์ถ์ถ๋ ์๋ณธ ๊ทธ๋๋ก๋ฅผ LLM๋ชจ๋ธ์ ๋ฃ์ด์ฃผ๋ฉด ์์์ ์ ํด์ํ๊ณ ๋ต๋ณ์ ์์ฑํ๋ค.(๋น์ฐํ LLM์ฑ๋ฅ์ ๋ฐ๋ผ ๋ต๋ณ ํ๋ฆฌํฐ๊ฐ ๋ฌ๋ผ์ง๋ค.)Python์ ํ์ฅ์ฑ์ด๋,, ์์ ์ด์์ด๋ค. ๊ฑฐ์ ๋ชจ๋ ํ์ฅ์์ ๋ฌธ์ํ์ผ์์ ํ ์คํธ๋ฅผ ์ถ์ถํ ์ ์๋ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ค.(์ง์ง์ฝ๋ค)ํด๋น ํฌ์คํ ์์๋ PPT, PDF, DOCX, HWP, XLSX๋ฑ์ ํ์ฅ์ ํ์ผ๋ค์ ํฌ..