์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- ๋ฐฑ์ค
- dp
- mobilenet
- numpy
- pytorch
- CROSS JOIN
- BFS
- Two Pointer
- ์ ๊ทํ
- ๊ทธ๋ํ
- ์ธ์ ๋ฆฌ์คํธ
- ์ธ์ ํ๋ ฌ
- ์ฐ์ฐ๋ ๊ฐ์
- Depthwise Separable Convolution
- 1x1 Convolution
- SQL
- dfs
- bottleneck
- feature map
- SQLD
- ๋ฐ์ดํฐ๋ชจ๋ธ๋ง
- get_dummies()
- SQLD ํ๊ธฐ
- depthwise convolution
- resnet
- skip connection
- Inductive Bias
- outer join
- ์๋ณ์
- ์ํฐํฐ
- Today
- Total
๋ชฉ๋ก2025/04 (2)
SJ_Koding

Llama-4 ๋ชจ๋ธ์ ํ ์คํธํ๋ ์ค ์๊พธ surrogates not allowed ์๋ฌ๊ฐ ๋ฐ์ํ๋ค. ์ด๋ชจํฐ์ฝ์ ๋ด๋ฑ์ผ๋ ค๊ณ ํ๋๊ฑด์ง, ๊ฐ๋์ฉ ํ๊ธ์ด ํฌ๊ฒ ์๊ณก๋๋ฉด์ ์ด์ํ๊ฒ ๋ต๋ณ์ด ์ค๊ฑฐ๋ ์ด ์๋ฌ๊ฐ ๋ฐ์ํ๋ค.Surrogates๋ผ๋ ๊ฐ๋ ์ ์ฒ์ ์ ํ๋๋ฐ ์ด๋ฅผ ์ดํดํ๊ธฐ ์ฝ๊ฒ ์๋ ์ฐจ๊ทผ์ฐจ๊ทผ ํ์ด์ ์ ๋ฆฌํ๋ค. ์ฐ์ UTF-16๊ณผ UTF-8์ ์ฐจ์ด๋ฅผ ์์๋ด์ผํ๋ค. ์์ฃผ ์ฝ๊ฒ.UTF-16์ 16๋นํธ์ ๊ณ ์ ๊ธธ์ด๋ฅผ ๊ฐ์ง๋ค. ๋ฐ๋ผ์ 0x10000์ด์์ ์ฝ๋ํฌ์ธํธ๋ฅผ ํ๋์ 16๋นํธ ๋จ์๋ก ํํํ ์ ์์ด์, ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Surrogate Pair๋ผ๋ ๊ฐ๋ ์ ์ฌ์ฉํ๋ค. ๊ฐ๋จํ ๋งํด 2๊ฐ์ UTF-16์ surrogate ์ฝ๋์ ๋ 2๊ฐ๋ฅผ ์ด์ฉํด 20๋นํธ์ ์ฝ๋ํฌ์ธํธ๋ฅผ ํํํ๋ค. *๊ธฐ์ต (์ด๋ ํ๋จ์ ์์ธํ ์์ ํ๋ค.)..

๋ง์ง๋ง ํฌ์คํ ์ดํ ์ด๋๋ง 5๊ฐ์์ ์๊ฐ์ด ํ๋ ๋๋ฐ, ์ฌ์ค ์ด ์ฌ์ด์ ํ์ฌ ์ด์ง๊ณผ ์ ์์ ํ๋๋ด ๋ธ๋ก๊ทธ๋ฅผ ์ ๊ฒฝ์ฐ์ง ๋ชปํ์ต๋๋ค.๊ธฐ์กด์๋ LLM ์ฑ๋ด ๊ตฌ์ถ์ ์ํ ์๋น์ค๋ฅผ ๊ฐ๋ฐํ๋ค๋ฉด, ํ์ฌ๋ RAG์ฑ๋ฅ์ ๊ทน๋ํ ํ ์ ์๋ Backbone๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋์ด๋ ์ ๋ฌด๋ฅผ ๋ด๋นํ๊ณ ์์ต๋๋ค.์ ํํ ์ ๋ฌด๋ ๋งํ ์ ์์ผ๋, ๋คํ์ค๋ฝ๊ฒ๋ ํน์ ๋๋ฉ์ธ์์ ๋๋ฃ์ ํจ๊ป ๊ธฐ์กด foundation๋ชจ๋ธ ๋ณด๋ค ์ข์ ์ฑ๋ฅ์ ๋ฌ์ฑํ ์ ์์๊ณ , ์ง๊ธ์ ์ด๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ธฐ ์ํด ๋ค์ํ ๊ธฐ๋ฒ์ ์ ์ฉํ๋ฉฐ ์คํํ๊ณ ์์ต๋๋ค.๊ฐ์ธ ๊ณต๋ถ ๊ฒธ hard negative mining์ ๊ฐ๋จํ ์ ๋ฆฌํฉ๋๋ค. Hard Negative๋?Text Embedding๋ชจ๋ธ์ ํ์ธํ๋ ํ ๋, MLM(Masked Language Modeling), NL..