๋ชฉ๋ก์ „์ฒด ๊ธ€ (88)

SJ_Koding

[LLM] Text Embedding๋ชจ๋ธ ํŒŒ์ธํŠœ๋‹์„ ์œ„ํ•œ Hard Negative Mining ๋ฐฉ๋ฒ•๋ก  ํ•ต์‹ฌ ์ •๋ฆฌ

๋งˆ์ง€๋ง‰ ํฌ์ŠคํŒ… ์ดํ›„ ์–ด๋Š๋ง 5๊ฐœ์›”์˜ ์‹œ๊ฐ„์ด ํ˜๋ €๋Š”๋ฐ, ์‚ฌ์‹ค ์ด ์‚ฌ์ด์— ํšŒ์‚ฌ ์ด์ง๊ณผ ์ ์‘์„ ํ•˜๋Š๋žด ๋ธ”๋กœ๊ทธ๋ฅผ ์‹ ๊ฒฝ์“ฐ์ง€ ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค.๊ธฐ์กด์—๋Š” LLM ์ฑ—๋ด‡ ๊ตฌ์ถ•์„ ์œ„ํ•œ ์„œ๋น„์Šค๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค๋ฉด, ํ˜„์žฌ๋Š” RAG์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™” ํ•  ์ˆ˜ ์žˆ๋Š” Backbone๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ์—…๋ฌด๋ฅผ ๋‹ด๋‹นํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค.์ •ํ™•ํ•œ ์—…๋ฌด๋Š” ๋งํ•  ์ˆ˜ ์—†์œผ๋‚˜, ๋‹คํ–‰์Šค๋Ÿฝ๊ฒŒ๋„ ํŠน์ • ๋„๋ฉ”์ธ์—์„œ ๋™๋ฃŒ์™€ ํ•จ๊ป˜ ๊ธฐ์กด foundation๋ชจ๋ธ ๋ณด๋‹ค ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์—ˆ๊ณ , ์ง€๊ธˆ์€ ์ด๋ณด๋‹ค ๋” ๋†’์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๊ธฐ๋ฒ•์„ ์ ์šฉํ•˜๋ฉฐ ์‹คํ—˜ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค.๊ฐœ์ธ ๊ณต๋ถ€ ๊ฒธ hard negative mining์„ ๊ฐ„๋‹จํžˆ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค. Hard Negative๋ž€?Text Embedding๋ชจ๋ธ์„ ํŒŒ์ธํŠœ๋‹ ํ•  ๋•Œ, MLM(Masked Language Modeling), NL..

LLM 2025. 4. 7. 16:50
[LLM] Docker compose๋ฅผ ํ™œ์šฉํ•œ sLLM ํŒŒ์ธํŠœ๋‹ ๋ฐ ์ถ”๋ก  ์ž๋™ํ™”ํ•˜๊ธฐ ไธ‹ํŽธ - Docker compose

์—ฌ๋Ÿฌ๋ถ„์˜ ์†Œ์Šค์ฝ”๋“œ๊ฐ€ ๋‹ด๊ฒจ์žˆ๋Š” Docker Image๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ๋นŒ๋“œํ–ˆ์Šต๋‹ˆ๋‹ค. ipynb๊ฐ€ ์•„๋‹Œ ์ด์ƒ ํ•™์Šต์„ ์‹คํ–‰ํ•˜๋Š” ์ฝ”๋“œ์™€ ์ถ”๋ก ์„ ์ง„ํ–‰ํ•˜๋Š” ์ฝ”๋“œ๊ฐ€ ๋ณ„๋„๋กœ ์กด์žฌํ•˜๊ณ , ํŠน์ • ๋ช…๋ น์„ ํ†ตํ•ด ์ˆ˜ํ–‰๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.   [LLM] Docker compose๋ฅผ ํ™œ์šฉํ•œ sLLM ํŒŒ์ธํŠœ๋‹ ๋ฐ ์ถ”๋ก  ์ž๋™ํ™”ํ•˜๊ธฐ ไธŠํŽธ - Docker Image ๋นŒ๋“œ๋Œ€ํ•™์ƒ๋•Œ ๋ถ€ํ„ฐ AI๋งŒ ์ „๊ณตํ•ด์˜ค๋‹ค๋ณด๋‹ˆ ๋ฐฑ์—”๋“œ ์ง€์‹์ด ํ„ฑ์—†์ด ๋ถ€์กฑํ•œ ๊ฒƒ์„ ๊นจ๋‹ซ๊ฒŒ ํ•ด์ค€ ํ”„๋กœ์ ํŠธ๋ฅผ ์ง„ํ–‰ํ•ด์™”์Šต๋‹ˆ๋‹ค.๊ทธ ์ค‘ Docker๋ฅผ ํ™œ์šฉํ•˜์—ฌ LLMํŒŒ์ธํŠœ๋‹ ๋ฐ ์ถ”๋ก ๋‹จ๊ณ„๋ฅผ ์ž๋™ํ™” ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์–ดsjkoding.tistory.com LLMํŒŒ์ธํŠœ๋‹ ํŠน์„ฑ์ƒ ํ™˜๊ฒฝ์„ ๋ถ„ํ• ํ•  ํ•„์š”๊ฐ€ ์ ์Šต๋‹ˆ๋‹ค. trainํƒ€์ž…๊ณผ inferenceํƒ€์ž…์˜ ํ™˜๊ฒฝ์€ ๊ฑฐ์˜ ๋™์ผํ•˜๋ฉฐ ์†Œ์Šค์ฝ”๋“œ๋งŒ ์ฐจ์ด๊ฐ€ ๋‚˜๊ธฐ ๋•Œ๋ฌธ์— ์ด ๋•Œ๋ฌธ์— ..

LLM 2024. 11. 18. 10:12
๋ฐฑ์ค€ 12865: ๋ฐฐ๋‚ญ๋ฌธ์ œ (knapsack)(๊ณจ๋“œ V) - DP

(๋…๋ฐฑ์ฒด ๊ธ€)์˜ค๋žœ๋งŒ์— ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์—ฐ์Šต์„ ํ•˜๋ ค๊ณ  ํ•œ๋‹ค. ๋ฐฐ๋‚ญ ๋ฌธ์ œ๋Š” DP๋ฅผ ์ž…๋ฌธํ• ๋•Œ ๋ฐ˜๋“œ์‹œ ๊ฑฐ์น˜๋Š” ๋ฌธ์ œ์ธ๋ฐ ์ œ๋Œ€๋กœ ์—ฐ์Šตํ•ด๋ณด๊ณ ์ž ๋‹ค์‹œ ํ•œ ๋ฒˆ ํ’€์—ˆ๋‹ค.DP๊ฐ€ ์–ด๋ ค์šด ์ด์œ ๋Š” ์ ํ™”์‹์„ ์„ธ์šฐ๋Š” ๊ฒƒ์ด ๋Œ€๋‹จํžˆ ์–ด๋ ต๋‹ค๊ณ  ๋Š๋‚€๋‹ค. ๋ฐฐ๋‚ญ๋ฌธ์ œ๋ฅผ ์ฒ˜์Œ ์ ‘ํ•˜๋ฉด ์ด ์—ญ์‹œ ์ ํ™”์‹์„ ์„ธ์šฐ๊ธฐ ์‰ฝ์ง€ ์•Š๊ณ  ์–ด๋–ป๊ฒŒ ์ ‘๊ทผํ•ด์•ผํ•˜๋Š”์ง€๋„ ๋ง‰๋ง‰ํ•˜๋‹ค.https://www.acmicpc.net/problem/12865๊ฐ„๋‹จํžˆ ๋งํ•˜๋ฉด 100๊ฐœ ์ด๋‚ด์˜ ๋ฌผ๊ฑด์€ ๊ฐ๊ฐ ๋ฌด๊ฒŒ์™€ ๊ฐ€์น˜๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ . ์ด๋ฅผ K kg์ด๋‚ด๋กœ ๋ฌผ๊ฑด๋“ค์„ ์ตœ๋Œ€๋กœ ๋‹ด์„ ์ˆ˜ ์žˆ์„ ๋•Œ, ๋ฌผ๊ฑด์„ ์–ด๋–ป๊ฒŒ ๋‹ด์•„์•ผ ์ตœ๊ณ ์˜ ๊ฐ€์น˜๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๋ฌป๋Š”๋‹ค. ๋ฌธ์ œ ์ดํ•ด ์ž์ฒด๋Š” ์–ด๋ ต์ง€ ์•Š๋‹ค.๋‹น์—ฐํžˆ ๋ชจ๋“  ๊ฒฝ์šฐ์˜ ์ˆ˜๋ฅผ ํƒ์ƒ‰ํ•˜๋Š” ์™„์ „ ํƒ์ƒ‰์„ ์ƒ๊ฐํ•ด ๋‚ผ ์ˆ˜ ์žˆ์ง€๋งŒ ๋ฌผ๊ฑด๋“ค์„ ๋‹ด๋ƒ or ์•ˆ๋‹ด๋ƒ๋กœ ๋ฌผ๊ฑด๋งˆ๋‹ค 2๊ฐœ์˜ ๊ฒฝ์šฐ์˜ ์ˆ˜๊ฐ€..

Algorithm 2024. 11. 15. 21:22
[LLM] Docker compose๋ฅผ ํ™œ์šฉํ•œ sLLM ํŒŒ์ธํŠœ๋‹ ๋ฐ ์ถ”๋ก  ์ž๋™ํ™”ํ•˜๊ธฐ ไธŠํŽธ - Docker Image ๋นŒ๋“œ

๋Œ€ํ•™์ƒ๋•Œ ๋ถ€ํ„ฐ AI๋งŒ ์ „๊ณตํ•ด์˜ค๋‹ค๋ณด๋‹ˆ ๋ฐฑ์—”๋“œ ์ง€์‹์ด ํ„ฑ์—†์ด ๋ถ€์กฑํ•œ ๊ฒƒ์„ ๊นจ๋‹ซ๊ฒŒ ํ•ด์ค€ ํ”„๋กœ์ ํŠธ๋ฅผ ์ง„ํ–‰ํ•ด์™”์Šต๋‹ˆ๋‹ค.๊ทธ ์ค‘ Docker๋ฅผ ํ™œ์šฉํ•˜์—ฌ LLMํŒŒ์ธํŠœ๋‹ ๋ฐ ์ถ”๋ก ๋‹จ๊ณ„๋ฅผ ์ž๋™ํ™” ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์–ด์•ผํ–ˆ๋Š”๋ฐ ์ œ๊ฐ€ ์‚ฝ์งˆํ•˜๋ฉด์„œ ์–ป์€ ๋‚ด์šฉ๋“ค์„ ์—ฌ๊ธฐ์— ์ •๋ฆฌํ•ด๋ณด๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค. LLMํŠน์„ฑ์ƒ GPUํ™˜๊ฒฝ์„ ์‚ฌ์šฉํ•ด์•ผ๋งŒ ํ•ฉ๋‹ˆ๋‹ค. ์ €๋Š” ํ•˜๋‚˜์˜ GPUํ™˜๊ฒฝ๊ณผ ๋ชจ๋ธ์— ํ•„์š”ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ•˜๋‚˜์˜ Image๋กœ ๋งŒ๋“ค๊ณ , trainable data ์ƒ์„ฑ, LLM Finetuning(LoRA), LLM Inference๋ฅผ ์ง„ํ–‰ํ•˜๋Š” 3๊ฐœ์˜ ์ปจํ…Œ์ด๋„ˆ๋ฅผ ๋งŒ๋“ค์–ด Docker compose๋ฅผ ํ™œ์šฉํ•ด ์ˆœ์ฐจ์ ์œผ๋กœ ์‹คํ–‰๋˜๊ฒŒ๋” ์ž๋™ํ™”๋ฅผ ์‹œ์ผœ๋ณผ ์˜ˆ์ •์ž…๋‹ˆ๋‹ค. ์ค€๋น„๋ฌผ: Docker์—”์ง„ Docker compose(v2), ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ ์ฝ”๋“œ(json), LLM ํŒŒ์ธํŠœ..

LLM 2024. 11. 13. 10:46
[LLM] Selective Reflection-Tuning ์š”์•ฝ ๋ฐ ์ •๋ฆฌ (feat. Reflection Llama-3.1 70B ๋…ผ๋ž€)

Selective Reflection Tuning Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-Tuning (2024.06)LLM Fine-tuning์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์œ„ํ•ด ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ์„ ํ–ฅ์ƒํ•˜๋ ค๋Š” ์‹œ๋„, ๊ทธ๋ฆฌ๊ณ  ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•๋ก ์ด ์—ฐ๊ตฌ๋˜์–ด์™”์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด๋Š” ๋ชจ๋‘ ํ•™์ƒ๋ชจ๋ธ(์ดํ•˜ Student, ์ฃผ๋กœ Llama-3.1 8B, Solar 10.8B ๋“ฑ๋“ฑ์˜ sLM๊ธ‰ ๋ชจ๋ธ)์˜ ํ˜ธํ™˜์„ฑ์„ ๊ณ ๋ คํ•˜์ง€ ์•Š์•˜๋‹ค๋Š” ๊ฒƒ์„ ํ•ต์‹ฌ์œผ๋กœ ์ด์•ผ๊ธฐํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ฆ‰ Student์˜ ์ œํ•œ๋œ ์„ฑ๋Šฅ๋•Œ๋ฌธ์— GPT4o๋“ฑ์ด ๋งŒ๋“ค์–ด๋‚ธ ๊ณ ํ’ˆ์งˆ ํ”„๋กฌํ”„ํŠธ๋กœ fine-tuning์„ ์ง„ํ–‰ํ•˜๋”๋ผ๋„ ์ด๋ฅผ ๋ชจ๋ฐฉํ•  ์ˆ˜ ์—†๋‹ค๋ผ๋Š” ์˜๋ฏธ๋กœ ๋ฐ›์•„๋“ค์—ฌ์ง‘๋‹ˆ๋‹ค...

LLM 2024. 9. 10. 16:27
์ œ3ํšŒ ETRI ํœด๋จผ์ดํ•ด ์ธ๊ณต์ง€๋Šฅ ๋…ผ๋ฌธ๊ฒฝ์ง„๋Œ€ํšŒ ๋Œ€์ƒ ๋ฆฌ๋ทฐ (ICTC2024 ๋ฐœํ‘œ)

์ œ3ํšŒ ETRI ํœด๋จผ์ดํ•ด ์ธ๊ณต์ง€๋Šฅ ๋…ผ๋ฌธ๊ฒฝ์ง„๋Œ€ํšŒ๋ณธ ๋Œ€ํšŒ๋Š” ํ•œ๊ตญ์ „์žํ†ต์‹ ์—ฐ๊ตฌ์›(ETRI)์ด ์ฃผ์ตœํ•˜๊ณ  ๊ณผํ•™๊ธฐ์ˆ ์ •๋ณดํ†ต์‹ ๋ถ€์™€ ๊ตญ๊ฐ€๊ณผํ•™๊ธฐ์ˆ ์—ฐ๊ตฌํšŒ(NST)๊ฐ€ ํ›„์›ํ•ฉ๋‹ˆ๋‹คaifactory.space์ฃผ์ตœ : ํ•œ๊ตญ์ „์žํ†ต์‹ ์—ฐ๊ตฌ์› (ETRI)ํ›„์› : ๊ณผํ•™์ •๋ณด๊ธฐ์ˆ ํ†ต์‹ ๋ถ€, ๊ตญ๊ฐ€๊ณผํ•™๊ธฐ์ˆ ์—ฐ๊ตฌํšŒ (NST)์šด์˜ : ์ธ๊ณต์ง€๋ŠฅํŒฉํ† ๋ฆฌ (AIFactory)๊ฐœ์š”ํ•ด๋‹น ๋Œ€ํšŒ๋Š” ๋‹ค์–‘ํ•œ ์Šค๋งˆํŠธํฐ, ์Šค๋งˆํŠธ์›Œ์น˜ ์„ผ์„œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ, ์ด๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ด 7๊ฐ€์ง€์˜ ๋ผ๋ฒจ์„ ์˜ˆ์ธกํ•˜๋Š” ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๊ณ   The 15th International Conference on ICT Convergence(ICTC 2024)์™€ ์—ฐ๊ณ„ํ•˜์—ฌ ๋…ผ๋ฌธ ํˆฌ๊ณ  ๋ฐ ์—‘์…‰๊นŒ์ง€ ์ด๋ฃจ์–ด์ ธ์•ผํ•ฉ๋‹ˆ๋‹ค. ์ œ 4ํšŒ ๋Œ€ํšŒ์—์„œ๋„ ์œ ์‚ฌํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ฒฝ์ง„๋Œ€ํšŒ๊ฐ€ ์ง„ํ–‰๋  ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค. ํ•ด๋‹น ํฌ์ŠคํŒ…์ด ๋Œ€ํšŒ ์ง„ํ–‰์—..

Deep Learning 2024. 8. 12. 14:50