์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- get_dummies()
- Depthwise Separable Convolution
- Inductive Bias
- dfs
- SQL
- numpy
- SQLD
- depthwise convolution
- ์ธ์ ๋ฆฌ์คํธ
- CROSS JOIN
- ์ํฐํฐ
- bottleneck
- dp
- resnet
- ๊ทธ๋ํ
- ์๋ณ์
- ๋ฐ์ดํฐ๋ชจ๋ธ๋ง
- Two Pointer
- ๋ฐฑ์ค
- pytorch
- BFS
- ์ธ์ ํ๋ ฌ
- ์ ๊ทํ
- SQLD ํ๊ธฐ
- feature map
- ์ฐ์ฐ๋ ๊ฐ์
- mobilenet
- outer join
- 1x1 Convolution
- skip connection
- Today
- Total
๋ชฉ๋กget_dummies() (2)
SJ_Koding
AI๊ฒฝ์ง๋ํ์์ ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ ๊ฐ๋ณ์ํ๋ฅผ ์งํํ ๋, get_dummies()๋ฅผ test์ ์ ์ฌ์ฉํ๋ฉด Data Leakage๋ถ์ ํ์์ ํด๋น๋๋ค. test์ ์ ๋ณผ ์ ์๋ค๋ ๊ฐ์ ์ ์๋ฐฐ๋๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฐ๋ผ์ Train์ ์ ๊ธฐ๋ฐ์ผ๋ก fit์ ์งํํ ํ, Test์ ์ ๋ํด transfrom์ ์งํํ๋ One-Hot Encoder๋ฑ์ ์ฌ์ฉํ ์ ์๋ค. ์ด๋ ๊ฒ ๋๋ฉด Train์ ์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ณ์ํ๊ฐ ์งํ๋๊ธฐ ๋๋ฌธ์ test๋ฅผ ๋ณด์ง ์์๋ ๊ฐ๋ฅํ๋ค. ๊ทธ๋ฐ๋ฐ ๋ฌธ๋, ์ค์ ์ํฉ์์์ ๋ฐ์ดํฐ๊ฐ ๋ ์ฌ๋๋๋ฐ ์๋ฅผ ๋ค์ด ์ํ ์ฅ๋ฅด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ด๊ฐ ํ์ ์์ธกํ๋ ์์ ๋ฅผ ๋ ์ฌ๋ ค๋ณด์. '์ก์ ', '๋๋ผ๋ง', '์ฝ๋ฏธ๋' ์ฅ๋ฅด์ ์ํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ํ์ฌ ๋ชจ๋ธ์ด ํ์ต๋์๋ค๊ณ ํ ๋, 'SF์ํ'๊ฐ ์ ๋ ฅ์ผ๋ก ๋ค์ด์ฌ ๊ฒฝ์ฐ์๋ ์ด๋ป๊ฒ ์ฒ๋ฆฌ..
pandas ํจํค์ง๋ ์๋์ผ๋ก ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ ๋ํด One-Hot์ธ์ฝ๋ฉ์ ์งํํ๋ ๋ฉ์๋๊ฐ ์กด์ฌํฉ๋๋ค. pd.get_dummies() ๊ฒฐ๊ณผ๋ฅผ ๋ฏธ๋ฆฌ ๋ณด์ฌ๋๋ฆฝ๋๋ค. df_train = pd.get_dummies(df_train) ์ปฌ๋ผ์ ์๊ฐ 10๊ฐ์์ 15๊ฐ๋ก ์ฆ๊ฐํ์๊ณ , stringํ์ ๋ํ ๋ฐ์ดํฐ๋ค์ ๋ํด ๋ชจ๋ One-Hot์ธ์ฝ๋ฉ์ด ์งํ๋ ๋ชจ์ต์ ๋๋ค. ์ฌ์ฉ ๋ฐฉ๋ฒ์ ์์ ์ ์๋์์ง๋ง ์์ธํ ์๋ ค๋๋ฆฝ๋๋ค. ๋จผ์ ์์๋ก ์ ์๋ ๋ฐ์ดํฐ๋ ๋ฐ์ด์ฝ์์ ์งํ๋๋ 'ํญ๊ท ๋ชธ๋ฌด๊ฒ ์์ธก ๊ฒฝ์ง๋ํ'์์ ์ ๊ณต๋ ๋ฐ์ดํฐ ์ ์ ๋๋ค. https://dacon.io/competitions/official/235862/data ํญ๊ท ๋ชธ๋ฌด๊ฒ ์์ธก ๊ฒฝ์ง๋ํ - DACON ์ข์์๋ 1๋ถ ๋ด์ ํ ๋ฒ๋ง ํด๋ฆญ ํ ์ ์์ต๋๋ค. dacon.io..