๋ชฉ๋ก์ „์ฒด ๊ธ€ (87)

SJ_Koding

Precision(์ •๋ฐ€๋„)์™€ Recall(์žฌํ˜„์œจ)์˜ ์˜๋ฏธ์™€ ์˜ˆ์‹œ ๊ทธ๋ฆฌ๊ณ  F1-score์— ๋Œ€ํ•˜์—ฌ.

Confused matrix (ํ˜ผ๋™ํ–‰๋ ฌ) Retrieved? (์–‘์„ฑ์œผ๋กœ ์˜ˆ์ธกํ–ˆ๋‹ˆ?) Relevant? (์‹ค์ œ ์–‘์„ฑ์ด๋‹ˆ?) YES NO YES TP FN NO FP TN T์˜ ์˜๋ฏธ: ์˜ˆ์ธก์ด ์„ฑ๊ณตํ•œ ๊ฒƒ TP: ์ฐธ์œผ๋กœ ์˜ˆ์ธกํ•œ ๊ฒƒ์ด ์‹ค์ œ๋กœ ์ฐธ (์ ์ค‘) TN: ๊ฑฐ์ง“์œผ๋กœ ์˜ˆ์ธกํ•œ ๊ฒƒ์ด ์‹ค์ œ๋กœ ๊ฑฐ์ง“ (์ ์ค‘) F์˜ ์˜๋ฏธ: ์˜ˆ์ธก์„ ์‹คํŒจํ•œ ๊ฒƒ FP: ์ฐธ์œผ๋กœ ์˜ˆ์ธกํ•œ ๊ฒƒ์ด ์‹ค์ œ๋กœ ๊ฑฐ์ง“ (์˜ค๋‹ต) FN: ๊ฑฐ์ง“์œผ๋กœ ์˜ˆ์ธกํ•œ ๊ฒƒ์ด ์‹ค์ œ๋กœ ์ฐธ (์˜ค๋‹ต) ์ •๋ฐ€๋„์™€ ์žฌํ˜„์œจ์„ ๊ณต๋ถ€ํ•  ๋•Œ, ์‹์„ ์™ธ์šฐ๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ ๋‹จ์–ด์˜ ์˜๋ฏธ๋ฅผ ํŒŒ์•…ํ•˜๋Š”๊ฒƒ์ด ์ค‘์š”. ์ดํ•ด๋ฅผ ์œ„ํ•ด ์ฝ”๋กœ๋‚˜๋ฐ”์ด๋Ÿฌ์Šค๋กœ ์˜ˆ๋ฅผ ๋“ค๊ฒ ์Šต๋‹ˆ๋‹ค. Precision(์ •๋ฐ€๋„)์™€ Recall(์žฌํ˜„์œจ) Precision (์ •๋ฐ€๋„) : ์–‘์„ฑ์œผ๋กœ ์˜ˆ์ธกํ•œ ๊ฒƒ์ค‘ ์‹ค์ œ๋กœ ์–‘์„ฑ์ธ ๋น„์œจ ex) ํ™•์ง„์ž๋กœ ๋ถ„๋ฅ˜๋œ ์‚ฌ๋žŒ์ด ์‹ค์ œ..

Data analysis/etc 2022. 3. 12. 13:37
05. [Dacon Basic] ํ•ญ๊ณต์‚ฌ ๊ณ ๊ฐ ๋งŒ์กฑ๋„ ์˜ˆ์ธก ๊ฒฝ์ง„๋Œ€ํšŒ (์ตœ์ข… 2๋“ฑ!!)

๋ฒ ์ด์Šค๋ผ์ธ์˜ EDA๋ฅผ ์ €๋งŒ์˜ ๋ฐฉ์‹์œผ๋กœ ์„ค๋ช…ํ•ด๋ณด์•˜๊ณ  ์Šค์ผ€์ผ๋ง, hard voting ์•™์ƒ๋ธ”, soft voting ๋“ฑ์˜ ๋‹ค์–‘ํ•œ ์‹œ๋„๋ฅผ ํ•ด๋ณด์•˜์Šต๋‹ˆ๋‹ค. ์ฒซ EDA๋ฅผ ์ง„ํ–‰ํ•ด๋ณด์•˜๊ณ  ์•„์ง์€ ์ฐธ๊ณ ํ•ด์„œ ํ•˜๋Š” ์ˆ˜์ค€์ด๋„ค์š”. ๋˜ ํ•˜์ดํผํŒŒ๋ผ๋ฉ”ํ„ฐ ํŠœ๋‹์— GridSearchCV๊ฐ€ ์ฃผ๋กœ ์“ฐ์ด๋Š”๊ฑธ ์•Œ๊ณ  ํ•œ ๋ฒˆ ์ ์šฉํ•ด๋ณด์•˜์Šต๋‹ˆ๋‹ค. GridSearchCV๋Š” ๊ฐ„๋‹จํžˆ ๋งํ•ด ์‚ฌ์šฉ์ž๊ฐ€ ํ•˜์ดํผ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋“ค์˜ ๊ฒฝ์šฐ์˜ ์ˆ˜๋ฅผ ์ง€์ •ํ•˜์—ฌ ์ตœ์ ์˜ ํ•˜์ดํผ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋ฅผ ์ฐพ์•„์ฃผ๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ๋ชจ๋ธ ํŠœ๋‹ ์‹œ์— ์‚ฌ์šฉ๋˜๋Š” ๊ธฐ๋Šฅ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ๊ณต๋ถ€ํ•˜๊ณ  ์ฒ˜์Œ์œผ๋กœ ์ ์šฉ ์‹œ์ผœ ๋ณด์•˜์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ๋ฅผ ์–ด๋–ป๊ฒŒ ํ•ด์•ผํ• ์ง€ ๊ฐ์ด ์•„์ง ์•ˆ์™€์„œ ์ด ์ ์€ ์ฐจ๊ทผ์ฐจ๊ทผ ํ•ด์ณ๋‚˜๊ฐ€๊ฒ ์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์™€ ๋‹ค์ค‘๊ณต์„ ์„ฑ ์ปฌ๋Ÿผ์„ ์ œ๊ฑฐํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค! ์ข‹๊ฒŒ ๋ด์ฃผ์„ธ์š” :) ๋„..

AI Competition 2022. 2. 8. 01:20
Matplotlib ๊ทธ๋ž˜ํ”„ n by m ํ˜•ํƒœ๋กœ ์—ฌ๋Ÿฌ ๊ฐœ ์ถœ๋ ฅํ•˜๊ธฐ (subplot)

Matplotlib์„ ์‚ฌ์šฉํ•˜๋‹ค๋ณด๋ฉด ๊ทธ๋ž˜ํ”„๋ฅผ ์„ธ๋กœ๋กœ ๋‚˜์—ดํ•˜์ง€ ์•Š๊ณ  ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด n by m ํ˜•ํƒœ๋กœ ์ถœ๋ ฅํ•˜๊ณ  ์‹ถ์€ ๊ฒฝ์šฐ๊ฐ€ ๋Œ€๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค. ์ด๋ฒˆ ๊ฒŒ์‹œ๊ธ€์€ Matplotlib์˜ subplot์— ๋Œ€ํ•ด ์•Œ์•„๋ด…๋‹ˆ๋‹ค. subplot์€ plt.subplot(n, m, idx) ํ˜•ํƒœ๋กœ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ n์€ ํ–‰์˜ ๊ฐœ์ˆ˜, m์€ ์—ด์˜ ๊ฐœ์ˆ˜๋ฅผ ์˜๋ฏธํ•˜๋ฉฐ subplot(4, 4, idx)๋Š” 4 x 4 ์˜ ํ˜•ํƒœ๋กœ ๊ทธ๋ž˜ํ”„๋“ค์„ ๋‚˜๋ˆ„์–ด ์ถœ๋ ฅํ•˜๊ฒ ๋‹ค! ๋ผ๋Š” ๋œป์ด๋ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ idx๋Š” 4x4์˜ ๋ฐ”๋‘‘ํŒ์ด ์žˆ์„๋•Œ ๋ช‡ ๋ฒˆ์งธ์— ๊ทธ๋ž˜ํ”„๋ฅผ ์ถœ๋ ฅํ• ๊ฑด์ง€์˜ ๊ฐ’์ž…๋‹ˆ๋‹ค. idx๊ฐ€ 6์ด๋ผ๋ฉด 2ํ–‰์˜ 2๋ฒˆ์งธ์— ์˜ฌ๊ฒƒ์ž…๋‹ˆ๋‹ค. * ์ฃผ์˜์‚ฌํ•ญ: subplot์˜ idx๋Š” 0์ด ์•„๋‹Œ 1๋ถ€ํ„ฐ ์‹œ์ž‘์ž…๋‹ˆ๋‹ค. ์ฆ‰ 1ํ–‰์˜ 1๋ฒˆ์งธ๋Š” 0์ด์•„๋‹Œ 1์ž…๋‹ˆ๋‹ค!. ์ฝ”๋“œ๋กœ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. impo..

Data analysis/Matplotlib 2022. 1. 7. 01:11