๋ชฉ๋ก์ „์ฒด ๊ธ€ (87)

SJ_Koding

Bottleneck ๊ตฌ์กฐ(resnet)์˜ ์„ค๋ช… ๋ฐ Pytorch ์˜ˆ์‹œ

๋ถ€์ œ: - ConvNeXt ์ดํ•ดํ•˜๊ธฐ 2ํŽธ - Bottleneck์ด๋ž€ ์šฉ์–ด ์ž์ฒด๋Š” ๋ณ‘๋ชฉํ˜„์ƒ์„ ์˜๋ฏธํ•œ๋‹ค. ์ •๋ง ๋งŽ์€ ๋ถ„์•ผ์—์„œ ์“ฐ์ด๋Š” ๋ง์ด๋‹ค. ์‹œ์Šคํ…œ ๋ถ„์•ผ์—์„œ์˜ ๋ณ‘๋ชฉํ˜„์ƒ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค. - ์‹œ์Šคํ…œ ๋‚ด์—์„œ ์ „์ฒด์ ์ธ ์ฒ˜๋ฆฌ ์†๋„๋ฅผ ๋–จ์–ด๋œจ๋ฆฌ๊ฒŒ ๋˜๋Š” ํŠน์ •ํ•œ ๋ถ€๋ถ„์„ ๊ฐ€๋ฆฌํ‚ค๋Š” ์šฉ์–ด - ์‹œ์Šคํ…œ์˜ CPU๋‚˜ ๋ฉ”๋ชจ๋ฆฌ, ๋””์Šคํฌ ๋“ฑ์˜ ์ž์› ์ค‘ ํ•˜๋‚˜๊ฐ€ ๋‹ค๋ฅธ ์ž์›๋“ค์— ๋น„ํ•ด ์ฒ˜๋ฆฌ ์†๋„๊ฐ€ ๋Š๋ ค์„œ, ์ „์ฒด์ ์ธ ์„ฑ๋Šฅ์„ ์ œํ•œํ•˜๋Š” ๊ฒฝ์šฐ๋ฅผ ๋งํ•จ ๊ทธ๋ ‡๋‹ค๋ฉด Deep leaning network์—์„œ ๋งํ•˜๋Š” ๋ณ‘๋ชฉํ˜„์ƒ ์ฆ‰, bottleneck layer๋Š” ๋ฌด์—‡์„ ์˜๋ฏธํ• ๊นŒ? Bottleneck์€ ๊ตฌ์กฐ๋Š” 2015๋…„ ResNet์— ์˜ํ•ด ๋„๋ฆฌ ์•Œ๋ ค์ง€๊ณ  ์‚ฌ์šฉ๋˜์—ˆ์œผ๋ฉฐ, ๋Œ€ํ‘œ์ ์œผ๋กœ ์•„๋ž˜์˜ ์‚ฌ์ง„์œผ๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค 1 x 1 convolution์„ ์‚ฌ์šฉํ•˜์—ฌ ์ฑ„๋„์„ ์ค„์ธ ..

Deep Learning 2024. 4. 3. 10:45
๊ฐœ์ธ ๊ธฐ๋ก์šฉ PyTorch ์˜ค๋ฅ˜ ๋ชจ์Œ

1. timm์—์„œ model๋ฅผ loadํ•œ ๋’ค, ์ €์žฅ๋œ ptํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ์™€ inference๋ฅผ ์‹œํ‚ค๋ฉด ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ๊ฐ์†Œํ–ˆ์Œ. --> model.eval()๋ฅผ ๋ฐ˜๋“œ์‹œ ์‹คํ–‰ํ•ด์ค˜์•ผํ•จ. with torch.no_grad๋Š” parameter update๋ฅผ ํ†ต์ œํ•  ๋ฟ, forward ๊ณผ์ •๊นŒ์ง€์˜ update๋ฅผ ํ†ต์ œํ•˜์ง€๋Š” ์•Š๋Š”๋‹ค. timm์€ default mode๋กœ train mode๋กœ ์„ค์ • ๋˜์–ด์žˆ์œผ๋ฏ€๋กœ eval()์„ ํ†ตํ•ด ๋ชจ๋“œ๋ฅผ ๋ฐ”๊ฟ”์ค˜์•ผํ•œ๋‹ค. eval()๋ชจ๋“œ๋Š” BatchNormalization์˜ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋ฅผ Train์‹œ ์…‹ํŒ…ํ•œ ๊ฐ’์„ ๊ทธ๋Œ€๋กœ ๊ฐ€์ ธ์˜ค์ง€๋งŒ, train()์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ผ BN์˜ parameter๋ฅผ ๋ณ€ํ™”์‹œํ‚ค๊ธฐ ๋•Œ๋ฌธ์—, ์„ฑ๋Šฅ์ด ์—‰๋ง์ด ๋˜์—ˆ๋˜ ๊ฒƒ์ด๋‹ค. (์ถ”๊ฐ€๋กœ dropout ๋ ˆ์ด์–ด๋„ ์™„์ „ํžˆ ๋ฌด์‹œํ•ด์ค€๋‹ค.) ์•„๋งˆ ..

PyTorch Code/Pytorch 2024. 3. 28. 14:08
GPT3์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 3ํŽธ) - Language Models are Few-Shot Learners

GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) What is GPT? Generative Pre Training of a la sjkoding.tistory.com GPT-2์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 2ํŽธ) GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) W sjkoding.tistory.com ์ด๋ฒˆ ํฌ์ŠคํŒ…๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํ—ˆ๋ฏผ์„๋‹˜์˜ ์œ ํŠœ๋ธŒ ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ..

LLM 2024. 3. 21. 14:48
GPT-2์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 2ํŽธ)

GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) What is GPT? Generative Pre Training of a la sjkoding.tistory.com ์ƒ์œ„ ํฌ์ŠคํŒ…์— ์ด์–ด์ง„ ๋‚ด์šฉ์ด๋‹ค. ์ด๋ฒˆ ํฌ์ŠคํŒ… ์—ญ์‹œ ํ—ˆ๋ฏผ์„๋‹˜์˜ ์œ ํŠœ๋ธŒ ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ•˜์˜€๋‹ค. GPT-1์˜ ๋‹จ์  "์–ด์จŒ๋“  fine tuning ๊ณผ์ •์ด ํ•„์š”ํ•˜๋‹ค" ์ด๋ฅผ ํ•ด๊ฒฐํ•œ ๊ฒƒ์ด GPT-2์ด๋‹ค. GPT-2๋Š” ์ด fine tuning ๊ณผ์ •์„ ์•„์˜ˆ ์—†์•ด๋‹ค. ์ฆ‰ ์œ„ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ GPT-2์—์„œ Task๋ณ„๋กœ ๋ณ„๋„์˜ Fine tuning์ด ํ•„์š”ํ•˜์ง€ ์•Š๋‹ค๋Š” ์˜๋ฏธ์ด๋‹ค. ๊ทธ๋ฆฌ๊ณ  GPT-2์˜ ..

LLM 2024. 3. 20. 19:41
GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ)

Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) What is GPT? Generative Pre Training of a language model (GPT)์˜ ์•ฝ์ž, ์—ฌ๊ธฐ์„œ ๋งํ•˜๋Š” language model๋ถ€ํ„ฐ ์ดํ•ดํ•ด๋ณด์ž. ๊ตฌ๊ธ€์ด๋‚˜ ์œ ํŠœ๋ธŒ๋ฅผ ๊ฒ€์ƒ‰ํ•  ๋•Œ, ์–ด๋–ค ๋‹จ์–ด๋ฅผ ์ž…๋ ฅํ•˜๋ฉด ๋‹ค์Œ ๋‹จ์–ด๊ฐ€ ์ถ”์ฒœ๋˜๋Š” ๊ฒƒ์„ ์ž์ฃผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ex) ์ž…๋ ฅ: GPT ์ถ”์ฒœ: GPT ์‚ฌ์šฉ๋ฒ•, GPT-4, GPT ์œ ๋ฃŒ, ... ๋“ฑ๋“ฑ language model์€ ์œ„ ์˜ˆ์‹œ์ฒ˜๋Ÿผ ํ˜„์žฌ ํ† ํฐ์„ ๊ฐ€์ง€๊ณ  ๋‹ค์Œ ํ† ํฐ์„ ์˜ˆ์ธกํ•˜๋Š” ํ–‰์œ„๋„ ๊ฐ€๋Šฅํ•˜๋‹ค. ์ด๋•Œ Language model์˜ ์žฅ์ ์€ ํŠน๋ณ„ํ•œ ๋ผ๋ฒจ๋ง์ด ํ•„์š” ์—†..

LLM 2024. 3. 20. 10:22