๋ชฉ๋ก2024/03 (6)

SJ_Koding

๊ฐœ์ธ ๊ธฐ๋ก์šฉ PyTorch ์˜ค๋ฅ˜ ๋ชจ์Œ

1. timm์—์„œ model๋ฅผ loadํ•œ ๋’ค, ์ €์žฅ๋œ ptํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ์™€ inference๋ฅผ ์‹œํ‚ค๋ฉด ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ๊ฐ์†Œํ–ˆ์Œ. --> model.eval()๋ฅผ ๋ฐ˜๋“œ์‹œ ์‹คํ–‰ํ•ด์ค˜์•ผํ•จ. with torch.no_grad๋Š” parameter update๋ฅผ ํ†ต์ œํ•  ๋ฟ, forward ๊ณผ์ •๊นŒ์ง€์˜ update๋ฅผ ํ†ต์ œํ•˜์ง€๋Š” ์•Š๋Š”๋‹ค. timm์€ default mode๋กœ train mode๋กœ ์„ค์ • ๋˜์–ด์žˆ์œผ๋ฏ€๋กœ eval()์„ ํ†ตํ•ด ๋ชจ๋“œ๋ฅผ ๋ฐ”๊ฟ”์ค˜์•ผํ•œ๋‹ค. eval()๋ชจ๋“œ๋Š” BatchNormalization์˜ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋ฅผ Train์‹œ ์…‹ํŒ…ํ•œ ๊ฐ’์„ ๊ทธ๋Œ€๋กœ ๊ฐ€์ ธ์˜ค์ง€๋งŒ, train()์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ผ BN์˜ parameter๋ฅผ ๋ณ€ํ™”์‹œํ‚ค๊ธฐ ๋•Œ๋ฌธ์—, ์„ฑ๋Šฅ์ด ์—‰๋ง์ด ๋˜์—ˆ๋˜ ๊ฒƒ์ด๋‹ค. (์ถ”๊ฐ€๋กœ dropout ๋ ˆ์ด์–ด๋„ ์™„์ „ํžˆ ๋ฌด์‹œํ•ด์ค€๋‹ค.) ์•„๋งˆ ..

PyTorch Code/Pytorch 2024. 3. 28. 14:08
GPT3์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 3ํŽธ) - Language Models are Few-Shot Learners

GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) What is GPT? Generative Pre Training of a la sjkoding.tistory.com GPT-2์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 2ํŽธ) GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) W sjkoding.tistory.com ์ด๋ฒˆ ํฌ์ŠคํŒ…๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํ—ˆ๋ฏผ์„๋‹˜์˜ ์œ ํŠœ๋ธŒ ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ..

LLM 2024. 3. 21. 14:48
GPT-2์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 2ํŽธ)

GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) What is GPT? Generative Pre Training of a la sjkoding.tistory.com ์ƒ์œ„ ํฌ์ŠคํŒ…์— ์ด์–ด์ง„ ๋‚ด์šฉ์ด๋‹ค. ์ด๋ฒˆ ํฌ์ŠคํŒ… ์—ญ์‹œ ํ—ˆ๋ฏผ์„๋‹˜์˜ ์œ ํŠœ๋ธŒ ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ•˜์˜€๋‹ค. GPT-1์˜ ๋‹จ์  "์–ด์จŒ๋“  fine tuning ๊ณผ์ •์ด ํ•„์š”ํ•˜๋‹ค" ์ด๋ฅผ ํ•ด๊ฒฐํ•œ ๊ฒƒ์ด GPT-2์ด๋‹ค. GPT-2๋Š” ์ด fine tuning ๊ณผ์ •์„ ์•„์˜ˆ ์—†์•ด๋‹ค. ์ฆ‰ ์œ„ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ GPT-2์—์„œ Task๋ณ„๋กœ ๋ณ„๋„์˜ Fine tuning์ด ํ•„์š”ํ•˜์ง€ ์•Š๋‹ค๋Š” ์˜๋ฏธ์ด๋‹ค. ๊ทธ๋ฆฌ๊ณ  GPT-2์˜ ..

LLM 2024. 3. 20. 19:41
GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ)

Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) What is GPT? Generative Pre Training of a language model (GPT)์˜ ์•ฝ์ž, ์—ฌ๊ธฐ์„œ ๋งํ•˜๋Š” language model๋ถ€ํ„ฐ ์ดํ•ดํ•ด๋ณด์ž. ๊ตฌ๊ธ€์ด๋‚˜ ์œ ํŠœ๋ธŒ๋ฅผ ๊ฒ€์ƒ‰ํ•  ๋•Œ, ์–ด๋–ค ๋‹จ์–ด๋ฅผ ์ž…๋ ฅํ•˜๋ฉด ๋‹ค์Œ ๋‹จ์–ด๊ฐ€ ์ถ”์ฒœ๋˜๋Š” ๊ฒƒ์„ ์ž์ฃผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ex) ์ž…๋ ฅ: GPT ์ถ”์ฒœ: GPT ์‚ฌ์šฉ๋ฒ•, GPT-4, GPT ์œ ๋ฃŒ, ... ๋“ฑ๋“ฑ language model์€ ์œ„ ์˜ˆ์‹œ์ฒ˜๋Ÿผ ํ˜„์žฌ ํ† ํฐ์„ ๊ฐ€์ง€๊ณ  ๋‹ค์Œ ํ† ํฐ์„ ์˜ˆ์ธกํ•˜๋Š” ํ–‰์œ„๋„ ๊ฐ€๋Šฅํ•˜๋‹ค. ์ด๋•Œ Language model์˜ ์žฅ์ ์€ ํŠน๋ณ„ํ•œ ๋ผ๋ฒจ๋ง์ด ํ•„์š” ์—†..

LLM 2024. 3. 20. 10:22
ADsP, ๋ฐ์ดํ„ฐ ๋ถ„์„ ์ค€์ „๋ฌธ๊ฐ€ 2์ผ ๊ณต๋ถ€ ํ•ฉ๊ฒฉํ›„๊ธฐ (40ํšŒ, ์ „๊ณต์ž ๊ธฐ์ค€)

์˜ˆ์ „์— KT AIVLE SCHOOL์ˆ˜๋ฃŒ์‹๋‚  ํŒ€์›๋“ค๋ผ๋ฆฌ ์ž๊ฒฉ์ฆ ์ด์•ผ๊ธฐ๋ฅผ ํ•˜๋‹ค๊ฐ€ "์ง€๊ธˆ ์‹ ์ฒญ๊ธฐ๊ฐ„์ด์—์š”!" ๋ผ๋Š” ๋ง์— ์ •๋ณด์ฒ˜๋ฆฌ๊ธฐ์‚ฌ, AdSP ์ž๊ฒฉ์ฆ ์‹ ์ฒญ์„ ํ–ˆ์—ˆ๊ณ , ์žŠ๊ณ ์žˆ๋‹ค๊ฐ€.. 3์ผ์ „์— ์•Œ๊ฒŒ๋˜์—ˆ๋‹ค. ์ •๋ณด์ฒ˜๋ฆฌ๊ธฐ์‚ฌ(ํ•„๊ธฐ)๋Š” 3์ผ ๊ณต๋ถ€๋กœ ํ•ฉ๊ฒฉํ•˜์˜€๊ณ (์ถ”ํ›„ ํฌ์ŠคํŒ… ์˜ˆ์ •) AdSP๋Š” 2์ผ ๋ฒผ๋ฝ์น˜๊ธฐ๋กœ ํ•ฉ๊ฒฉํ–ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ๋งํ•˜๋Š” 2์ผ์€ ๋…์„œ์‹ค์— ์˜ค์ „ 10์‹œ ๋ถ€ํ„ฐ ๋ฐค 11์‹œ๊นŒ์ง€. ํ•˜๋ฃจ ์ข…์ผ ํˆฌ์žํ•œ 2์ผ์ด๋‹ค. ์‚ฌ์šฉ ๊ต์žฌ2024 ์ด์ง€ํŒจ์Šค ADsP ๋ฐ์ดํ„ฐ๋ถ„์„ ์ค€์ „๋ฌธ๊ฐ€ ์ด ๊ต์žฌ๋ฅผ ์‚ฌ์šฉํ•œ ์ด์œ ๋Š” ์ด๋ก  ๋‚ด์šฉ๋„ ๋‚ด์šฉ์ด์ง€๋งŒ, ๋ฌด์—‡๋ณด๋‹ค ๊ธฐ์ถœ๋ฌธ์ œ ์ œ๊ณต์ด ์ปธ๋‹ค. ADsP๋„ ๊ธฐ์ถœ์€ํ–‰์‹์ด๋ผ๋Š” ๋ง์„ ๋“ค์—ˆ์—ˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. (๊ทธ๋ ‡๋‹ค๊ณ  ๋„ˆ๋ฌด ๊ธฐ์ถœ์€ํ–‰์€ ์•„๋‹ˆ์—ˆ์—ˆ๋‹ค. 2024๋…„ ์ฒซ ์‹œํ—˜์ด์—ˆ๋˜ 40ํšŒ๋Š” ์ฃผ๊ด€์‹์ด ์‚ฌ๋ผ์ง€๊ณ  ์‹ ์œ ํ˜•์ด ๋งŽ์ด ๋‚˜์˜จ ๋А๋‚Œ์ด์—ˆ๋‹ค.)์ผ๋‹จ ๋ฌด์ž‘..

Certification 2024. 3. 16. 11:30
๋ฐฑ์ค€ 1715: ์นด๋“œ ์ •๋ ฌํ•˜๊ธฐ(๊ณจ๋“œ IV) - Priority Queue

1715๋ฒˆ: ์นด๋“œ ์ •๋ ฌํ•˜๊ธฐ ์ •๋ ฌ๋œ ๋‘ ๋ฌถ์Œ์˜ ์ˆซ์ž ์นด๋“œ๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•˜์ž. ๊ฐ ๋ฌถ์Œ์˜ ์นด๋“œ์˜ ์ˆ˜๋ฅผ A, B๋ผ ํ•˜๋ฉด ๋ณดํ†ต ๋‘ ๋ฌถ์Œ์„ ํ•ฉ์ณ์„œ ํ•˜๋‚˜๋กœ ๋งŒ๋“œ๋Š” ๋ฐ์—๋Š” A+B ๋ฒˆ์˜ ๋น„๊ต๋ฅผ ํ•ด์•ผ ํ•œ๋‹ค. ์ด๋ฅผํ…Œ๋ฉด, 20์žฅ์˜ ์ˆซ์ž ์นด๋“œ ๋ฌถ์Œ๊ณผ 30์žฅ www.acmicpc.net ์šฐ์„ ์ˆœ์œ„ ํ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ฌธ์ œ์ธ ๊ฒƒ ๊ฐ™๋‹ค. ๋ฌธ์ œ ์š”์•ฝ: ์—ฌ๋Ÿฌ ์žฅ์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋ฑ๋“ค์„ ํ•˜๋‚˜๋กœ ํ•ฉ์น  ๋•Œ, ์ตœ์†Œ ๋น„๊ต ํšŸ์ˆ˜๋กœ ํ•ฉ์น  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ• ex) 10์žฅ, 20์žฅ, 40์žฅ์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋ฑ์—์„œ 10์žฅ์งœ๋ฆฌ์™€ 20์žฅ์งœ๋ฆฌ๋ฅผ ํ•ฉ์น˜๋Š”๋ฐ 30๋ฒˆ์˜ ๋น„๊ต๊ฐ€ ๋“ค๊ณ  ํ•ฉ์ณ์ง„ 30์žฅ๊ณผ 40์žฅ์„ ํ•ฉ์น ๋•Œ๋Š” 70๋ฒˆ์˜ ๋น„๊ต๊ฐ€ ์†Œ์š”๋˜์–ด ์ด 100๋ฒˆ์˜ ๋น„๊ต๊ฐ€ ์ˆ˜ํ–‰. ๋งŒ์•ฝ 10์žฅ๊ณผ 40์žฅ์„ ๋จผ์ € ํ•ฉ์น˜๊ณ  20์žฅ๊ณผ ํ•ฉ์นœ๋‹ค๋ฉด (10+40) + (50 + 20) == 120์ด ๋˜์–ด ์ตœ์†Œ..

Algorithm/Greedy 2024. 3. 5. 00:07