์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Two Pointer
- 1x1 Convolution
- ์ฐ์ฐ๋ ๊ฐ์
- ์ธ์ ๋ฆฌ์คํธ
- get_dummies()
- mobilenet
- feature map
- ๋ฐฑ์ค
- ์ํฐํฐ
- resnet
- BFS
- Inductive Bias
- ์ ๊ทํ
- SQLD
- ๋ฐ์ดํฐ๋ชจ๋ธ๋ง
- skip connection
- outer join
- SQL
- ์ธ์ ํ๋ ฌ
- CROSS JOIN
- depthwise convolution
- bottleneck
- numpy
- ์๋ณ์
- SQLD ํ๊ธฐ
- ๊ทธ๋ํ
- Depthwise Separable Convolution
- dfs
- pytorch
- dp
- Today
- Total
๋ชฉ๋กget_dummies() (2)
SJ_Koding
AI๊ฒฝ์ง๋ํ์์ ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ ๊ฐ๋ณ์ํ๋ฅผ ์งํํ ๋, get_dummies()๋ฅผ test์ ์ ์ฌ์ฉํ๋ฉด Data Leakage๋ถ์ ํ์์ ํด๋น๋๋ค. test์ ์ ๋ณผ ์ ์๋ค๋ ๊ฐ์ ์ ์๋ฐฐ๋๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฐ๋ผ์ Train์ ์ ๊ธฐ๋ฐ์ผ๋ก fit์ ์งํํ ํ, Test์ ์ ๋ํด transfrom์ ์งํํ๋ One-Hot Encoder๋ฑ์ ์ฌ์ฉํ ์ ์๋ค. ์ด๋ ๊ฒ ๋๋ฉด Train์ ์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ณ์ํ๊ฐ ์งํ๋๊ธฐ ๋๋ฌธ์ test๋ฅผ ๋ณด์ง ์์๋ ๊ฐ๋ฅํ๋ค. ๊ทธ๋ฐ๋ฐ ๋ฌธ๋, ์ค์ ์ํฉ์์์ ๋ฐ์ดํฐ๊ฐ ๋ ์ฌ๋๋๋ฐ ์๋ฅผ ๋ค์ด ์ํ ์ฅ๋ฅด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ด๊ฐ ํ์ ์์ธกํ๋ ์์ ๋ฅผ ๋ ์ฌ๋ ค๋ณด์. '์ก์ ', '๋๋ผ๋ง', '์ฝ๋ฏธ๋' ์ฅ๋ฅด์ ์ํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ํ์ฌ ๋ชจ๋ธ์ด ํ์ต๋์๋ค๊ณ ํ ๋, 'SF์ํ'๊ฐ ์ ๋ ฅ์ผ๋ก ๋ค์ด์ฌ ๊ฒฝ์ฐ์๋ ์ด๋ป๊ฒ ์ฒ๋ฆฌ..
pandas ํจํค์ง๋ ์๋์ผ๋ก ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ ๋ํด One-Hot์ธ์ฝ๋ฉ์ ์งํํ๋ ๋ฉ์๋๊ฐ ์กด์ฌํฉ๋๋ค. pd.get_dummies() ๊ฒฐ๊ณผ๋ฅผ ๋ฏธ๋ฆฌ ๋ณด์ฌ๋๋ฆฝ๋๋ค. df_train = pd.get_dummies(df_train) ์ปฌ๋ผ์ ์๊ฐ 10๊ฐ์์ 15๊ฐ๋ก ์ฆ๊ฐํ์๊ณ , stringํ์ ๋ํ ๋ฐ์ดํฐ๋ค์ ๋ํด ๋ชจ๋ One-Hot์ธ์ฝ๋ฉ์ด ์งํ๋ ๋ชจ์ต์ ๋๋ค. ์ฌ์ฉ ๋ฐฉ๋ฒ์ ์์ ์ ์๋์์ง๋ง ์์ธํ ์๋ ค๋๋ฆฝ๋๋ค. ๋จผ์ ์์๋ก ์ ์๋ ๋ฐ์ดํฐ๋ ๋ฐ์ด์ฝ์์ ์งํ๋๋ 'ํญ๊ท ๋ชธ๋ฌด๊ฒ ์์ธก ๊ฒฝ์ง๋ํ'์์ ์ ๊ณต๋ ๋ฐ์ดํฐ ์ ์ ๋๋ค. https://dacon.io/competitions/official/235862/data ํญ๊ท ๋ชธ๋ฌด๊ฒ ์์ธก ๊ฒฝ์ง๋ํ - DACON ์ข์์๋ 1๋ถ ๋ด์ ํ ๋ฒ๋ง ํด๋ฆญ ํ ์ ์์ต๋๋ค. dacon.io..