๋ชฉ๋ก2025/04/07 (1)

SJ_Koding

[LLM] Text Embedding๋ชจ๋ธ ํŒŒ์ธํŠœ๋‹์„ ์œ„ํ•œ Hard Negative Mining ๋ฐฉ๋ฒ•๋ก  ํ•ต์‹ฌ ์ •๋ฆฌ

๋งˆ์ง€๋ง‰ ํฌ์ŠคํŒ… ์ดํ›„ ์–ด๋Š๋ง 5๊ฐœ์›”์˜ ์‹œ๊ฐ„์ด ํ˜๋ €๋Š”๋ฐ, ์‚ฌ์‹ค ์ด ์‚ฌ์ด์— ํšŒ์‚ฌ ์ด์ง๊ณผ ์ ์‘์„ ํ•˜๋Š๋žด ๋ธ”๋กœ๊ทธ๋ฅผ ์‹ ๊ฒฝ์“ฐ์ง€ ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค.๊ธฐ์กด์—๋Š” LLM ์ฑ—๋ด‡ ๊ตฌ์ถ•์„ ์œ„ํ•œ ์„œ๋น„์Šค๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค๋ฉด, ํ˜„์žฌ๋Š” RAG์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™” ํ•  ์ˆ˜ ์žˆ๋Š” Backbone๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ์—…๋ฌด๋ฅผ ๋‹ด๋‹นํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค.์ •ํ™•ํ•œ ์—…๋ฌด๋Š” ๋งํ•  ์ˆ˜ ์—†์œผ๋‚˜, ๋‹คํ–‰์Šค๋Ÿฝ๊ฒŒ๋„ ํŠน์ • ๋„๋ฉ”์ธ์—์„œ ๋™๋ฃŒ์™€ ํ•จ๊ป˜ ๊ธฐ์กด foundation๋ชจ๋ธ ๋ณด๋‹ค ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์—ˆ๊ณ , ์ง€๊ธˆ์€ ์ด๋ณด๋‹ค ๋” ๋†’์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๊ธฐ๋ฒ•์„ ์ ์šฉํ•˜๋ฉฐ ์‹คํ—˜ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค.๊ฐœ์ธ ๊ณต๋ถ€ ๊ฒธ hard negative mining์„ ๊ฐ„๋‹จํžˆ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค. Hard Negative๋ž€?Text Embedding๋ชจ๋ธ์„ ํŒŒ์ธํŠœ๋‹ ํ•  ๋•Œ, MLM(Masked Language Modeling), NL..

LLM 2025. 4. 7. 16:50