๋ชฉ๋ก์ „์ฒด ๊ธ€ (89)

SJ_Koding

ConvNeXt (A ConvNet for the 2020s, facebook) ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ

- ๋ถ€์ œ: ConvNeXt ์ดํ•ดํ•˜๊ธฐ ์ตœ์ข… - Image Classification model์„ ํ•™์Šตํ•  ์ƒํ™ฉ์ด ์ƒ๊ฒจ์„œ ConvNeXt๋ฅผ ์‚ฌ์šฉํ•ด๋ดค๋Š”๋ฐ ์„ฑ๋Šฅ์ด ์ •๋ง ์ข‹๊ฒŒ ๋‚˜์™”๋‹ค. ๋Œ€์ฒด ์ด ๋ชจ๋ธ์ด ๋ญ๊ธธ๋ž˜? ํ•˜๊ณ  ๋ดค๋”๋‹ˆ Facebook์ด ๋ฐœํ‘œํ•œ ๋…ผ๋ฌธ์ด์–ด์„œ ํฅ๋ฏธ๊ฐ€ ์ƒ๊ฒจ ์ด ๋…ผ๋ฌธ์„ ๊ณต๋ถ€ํ•˜๊ฒŒ๋˜์—ˆ๋‹ค. ๋…ผ๋ฌธ์„ ์ฝ์œผ๋ฉด์„œ ์ •๋ง CNN์— ๋Œ€ํ•ด ๊ณต๋ถ€ํ•˜๊ธฐ ์ข‹์€ ๋…ผ๋ฌธ์ด๋ผ๋Š” ์ƒ๊ฐ์ด ๋“ค์—ˆ๋‹ค. ๋˜, ๋…ผ๋ฌธ๊ตฌ์„ฑ์ด ์ •๋ง ์žฌ๋ฐŒ๋‹ค. ์—ฐ๊ตฌ์— ๋”ฐ๋ฅธ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ˆœ์ฐจ์ ์œผ๋กœ ๋ฐฐ์น˜ํ•˜์—ฌ ๋งˆ์น˜ ํ•จ๊ป˜ ์—ฐ๊ตฌ๋ฅผ ํ•œ ๊ฒƒ๊ณผ ๊ฐ™์€ ๋А๋‚Œ์„ ์ค€๋‹ค. ์–ด๋–ค ๋‚ด์šฉ์ด๊ธธ๋ž˜? extreme ์š”์•ฝ: CNN๊ณ„์—ด ๋ชจ๋ธ(ResNet50์‚ฌ์šฉ)์„ ์ตœ์‹ ์— ์•Œ๋ ค์ง„ ๊ธฐ๋ฒ•์„ ์ ์šฉํ•˜๋ฉด์„œ ๊ทนํ•œ์œผ๋กœ ๋Œ์–ด์˜ฌ๋ ค๋ณด์ž~! ๋Œ€์‹ , pure CNN์œผ๋กœ. ์„ฑ๊ณต~! Abstract 2020๋…„๋Œ€, Vision Task์—์„œ..

Deep Learning 2024. 4. 4. 13:46
manifold์™€ Inverted Bottleneck์˜ ์„ค๋ช…

- ๋ถ€์ œ: ConvNeXt์ดํ•ดํ•˜๊ธฐ 5ํŽธ- (๋ณธ ํฌ์ŠคํŒ…์€ https://gaussian37.github.io ๊น€์ง„์†” ์—ฐ๊ตฌ์›๋‹˜์˜ MobileNet V2 ๋ธ”๋กœ๊ทธ ๊ธ€์„ ์ ๊ทน ์ฐธ๊ณ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.) ์ผ๋ฐ˜์ ์ธ Bottleneck๊ตฌ์กฐ๋Š” ์•„๋ž˜ ํฌ์ŠคํŒ…์—์„œ ๋‹ค๋ค˜๋‹ค. Bottleneck ๊ตฌ์กฐ(resnet)์˜ ์„ค๋ช… ๋ฐ Pytorch ์˜ˆ์‹œ ๋ถ€์ œ: - ConvNeXt ์ดํ•ดํ•˜๊ธฐ 2ํŽธ - Bottleneck์ด๋ž€ ์šฉ์–ด ์ž์ฒด๋Š” ๋ณ‘๋ชฉํ˜„์ƒ์„ ์˜๋ฏธํ•œ๋‹ค. ์ •๋ง ๋งŽ์€ ๋ถ„์•ผ์—์„œ ์“ฐ์ด๋Š” ๋ง์ด๋‹ค. ์‹œ์Šคํ…œ ๋ถ„์•ผ์—์„œ์˜ ๋ณ‘๋ชฉํ˜„์ƒ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค. - ์‹œ์Šคํ…œ ๋‚ด์—์„œ ์ „์ฒด์  sjkoding.tistory.com Manifold CNN์—์„œ manifold๊ฐœ๋…์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์กด์žฌํ•˜๋Š” ๊ณ ์ฐจ์› ๊ณต๊ฐ„ ๋‚ด์—์„œ์˜ ์ €์ฐจ์›์  '๊ตฌ์กฐ'๋ฅผ ์˜๋ฏธํ•œ๋‹ค. CNN์„ ํฌํ•จํ•œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๋“ค..

Deep Learning 2024. 4. 4. 11:28
Bottleneck ๊ตฌ์กฐ(resnet)์˜ ์„ค๋ช… ๋ฐ Pytorch ์˜ˆ์‹œ

๋ถ€์ œ: - ConvNeXt ์ดํ•ดํ•˜๊ธฐ 2ํŽธ - Bottleneck์ด๋ž€ ์šฉ์–ด ์ž์ฒด๋Š” ๋ณ‘๋ชฉํ˜„์ƒ์„ ์˜๋ฏธํ•œ๋‹ค. ์ •๋ง ๋งŽ์€ ๋ถ„์•ผ์—์„œ ์“ฐ์ด๋Š” ๋ง์ด๋‹ค. ์‹œ์Šคํ…œ ๋ถ„์•ผ์—์„œ์˜ ๋ณ‘๋ชฉํ˜„์ƒ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค. - ์‹œ์Šคํ…œ ๋‚ด์—์„œ ์ „์ฒด์ ์ธ ์ฒ˜๋ฆฌ ์†๋„๋ฅผ ๋–จ์–ด๋œจ๋ฆฌ๊ฒŒ ๋˜๋Š” ํŠน์ •ํ•œ ๋ถ€๋ถ„์„ ๊ฐ€๋ฆฌํ‚ค๋Š” ์šฉ์–ด - ์‹œ์Šคํ…œ์˜ CPU๋‚˜ ๋ฉ”๋ชจ๋ฆฌ, ๋””์Šคํฌ ๋“ฑ์˜ ์ž์› ์ค‘ ํ•˜๋‚˜๊ฐ€ ๋‹ค๋ฅธ ์ž์›๋“ค์— ๋น„ํ•ด ์ฒ˜๋ฆฌ ์†๋„๊ฐ€ ๋А๋ ค์„œ, ์ „์ฒด์ ์ธ ์„ฑ๋Šฅ์„ ์ œํ•œํ•˜๋Š” ๊ฒฝ์šฐ๋ฅผ ๋งํ•จ ๊ทธ๋ ‡๋‹ค๋ฉด Deep leaning network์—์„œ ๋งํ•˜๋Š” ๋ณ‘๋ชฉํ˜„์ƒ ์ฆ‰, bottleneck layer๋Š” ๋ฌด์—‡์„ ์˜๋ฏธํ• ๊นŒ? Bottleneck์€ ๊ตฌ์กฐ๋Š” 2015๋…„ ResNet์— ์˜ํ•ด ๋„๋ฆฌ ์•Œ๋ ค์ง€๊ณ  ์‚ฌ์šฉ๋˜์—ˆ์œผ๋ฉฐ, ๋Œ€ํ‘œ์ ์œผ๋กœ ์•„๋ž˜์˜ ์‚ฌ์ง„์œผ๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค 1 x 1 convolution์„ ์‚ฌ์šฉํ•˜์—ฌ ์ฑ„๋„์„ ์ค„์ธ ..

Deep Learning 2024. 4. 3. 10:45
๊ฐœ์ธ ๊ธฐ๋ก์šฉ PyTorch ์˜ค๋ฅ˜ ๋ชจ์Œ

1. timm์—์„œ model๋ฅผ loadํ•œ ๋’ค, ์ €์žฅ๋œ ptํŒŒ์ผ์„ ๋ถˆ๋Ÿฌ์™€ inference๋ฅผ ์‹œํ‚ค๋ฉด ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ๊ฐ์†Œํ–ˆ์Œ. --> model.eval()๋ฅผ ๋ฐ˜๋“œ์‹œ ์‹คํ–‰ํ•ด์ค˜์•ผํ•จ. with torch.no_grad๋Š” parameter update๋ฅผ ํ†ต์ œํ•  ๋ฟ, forward ๊ณผ์ •๊นŒ์ง€์˜ update๋ฅผ ํ†ต์ œํ•˜์ง€๋Š” ์•Š๋Š”๋‹ค. timm์€ default mode๋กœ train mode๋กœ ์„ค์ • ๋˜์–ด์žˆ์œผ๋ฏ€๋กœ eval()์„ ํ†ตํ•ด ๋ชจ๋“œ๋ฅผ ๋ฐ”๊ฟ”์ค˜์•ผํ•œ๋‹ค. eval()๋ชจ๋“œ๋Š” BatchNormalization์˜ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋ฅผ Train์‹œ ์…‹ํŒ…ํ•œ ๊ฐ’์„ ๊ทธ๋Œ€๋กœ ๊ฐ€์ ธ์˜ค์ง€๋งŒ, train()์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ผ BN์˜ parameter๋ฅผ ๋ณ€ํ™”์‹œํ‚ค๊ธฐ ๋•Œ๋ฌธ์—, ์„ฑ๋Šฅ์ด ์—‰๋ง์ด ๋˜์—ˆ๋˜ ๊ฒƒ์ด๋‹ค. (์ถ”๊ฐ€๋กœ dropout ๋ ˆ์ด์–ด๋„ ์™„์ „ํžˆ ๋ฌด์‹œํ•ด์ค€๋‹ค.) ์•„๋งˆ ..

PyTorch Code/Pytorch 2024. 3. 28. 14:08
GPT3์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 3ํŽธ) - Language Models are Few-Shot Learners

GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) What is GPT? Generative Pre Training of a la sjkoding.tistory.com GPT-2์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 2ํŽธ) GPT-1์— ๋Œ€ํ•ด ์ดํ•ดํ•ด๋ณด์ž (GPT 1ํŽธ) Chat GPT์˜ ์‹œ์ดˆ, GPT-1 ๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณด์ž (๋ณธ ํฌ์ŠคํŒ…์€ AI์—…๊ณ„์—์„œ ์œ ๋ช…ํ•˜์‹  ํ—ˆ๋ฏผ์„ ๊ฐœ๋ฐœ์ž๋‹˜์˜ ์œ ํŠœ๋ธŒ GPT-1(๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์•Œ์•„๋ณด๋Š” GPT) ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.) W sjkoding.tistory.com ์ด๋ฒˆ ํฌ์ŠคํŒ…๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํ—ˆ๋ฏผ์„๋‹˜์˜ ์œ ํŠœ๋ธŒ ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ..

LLM 2024. 3. 21. 14:48