์ ์ฒด ๊ธ
Sklearn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌํ๊ธฐ
2์ฃผ๊ฐ ํ์ด์ฌ์ Sklearn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ณต๋ถํ์์ต๋๋ค. ๊ต์ฅํ ํธ๋ฆฌํ๊ฒ ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํ๊ณ ๋ชจ๋ธ๋งํ ์ ์๋ ๋ค์ํ ๊ธฐ๋ฅ๋ค์ ๋ฐฐ์ธ ์ ์์์ต๋๋ค. ์ด๋ฒ ๊ธ์๋ Sklearn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ๋ค์ ์ตํ๊ณ , ์ค์ต์ผ๋ก ํ์ดํ๋์ ์์กด์๋ฅผ ์์ธกํ๋ ๋ฌธ์ ์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํด๋ณด๊ฒ ์ต๋๋ค. ๋ฌธ์ ์๊ฐ : Titanic - Machine Learning from Disaster Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com *Titanic ๋ฌธ์ ๋ Kaggle์ Hello World๋ผ๊ณ ๋ถ๋ฆด ์ ๋๋ก ๋ง์ ์ฌ๋๋ค์ด ์ฒ์ Kaggle์์ ๋จธ์ ๋ฌ๋ ๋ฌธ์ ๋ฅผ ํ ๋ ์์ํ๋ ๋ฌธ์ ์ ๋๋ค. 1912๋ ์ ํ์ดํ๋ํธ๊ฐ ๋น์ฐ์ ๋ถ๋ชํ๋ฉฐ ..
ํ์ด์ฌ์ผ๋ก ๋จธ์ ๋ฌ๋ ์์ํ๊ธฐ
๋จธ์ ๋ฌ๋์ด๋? ์ํ๊ณ ์ ๋ฑ์ฅ ์ ๊ฐ ๋จธ์ ๋ฌ๋์ ๊ด์ฌ์ ๊ฐ๊ธฐ ์์ํ ๊ณ๊ธฐ๋ ์ํ๊ณ ์ ๋ฑ์ฅ์ด์์ต๋๋ค. ๋น์ ์ ๋ ์ปดํจํฐ๊ณตํ๊ณผ 1ํ๋ ํ์์ด์์ต๋๋ค. ์ธ๋ก ์์๋ ์ํ๊ณ ์ ์ด์ธ๋ 9๋จ์ ๋๊ตญ์ผ๋ก ๋จ๊ฒ๊ฒ ๋ฌ๊ตฌ์ด์ง๊ณ ์์์ต๋๋ค. ์ํ๊ณ ์ ๋ฑ์ฅ์ผ๋ก ํ๊ตญ์๋ ๋จธ์ ๋ฌ๋ ์ดํ์ด ๋ถ๊ธฐ ์์ํ๋ฉฐ ์ ๋ ์์ฐ์ค๋ฝ๊ฒ ๋จธ์ ๋ฌ๋์ ๊ด์ฌ์ ๊ฐ์ง๊ฒ ๋์์ต๋๋ค. ๋จธ์ ๋ฌ๋์ด๋? ๋จธ์ ๋ฌ๋์ ๊ธฐ๊ณ๊ฐ ์ง์ ํ์ต์ ํ์ฌ ๊ฒฐ์ ์ ๋ด๋ฆด ์ ์๋๋ก ๋ชจ๋ธ๋งํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์๋ฅผ๋ค์ด ์ด๋ฏธ์ง๋ฅผ ์ ๊ณตํ๋ฉด ๊ทธ ์ด๋ฏธ์ง๊ฐ ์ด๋ค ๋๋ฌผ์ธ์ง๋ฅผ ์ปดํจํฐ๊ฐ ์ง์ ๊ฒฐ์ ํ๋๋ก ๋ง๋๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. 0๊ณผ 1๋ง์ ์ธ์ํ๋ ์ปดํจํฐ๊ฐ ์ค์ค๋ก ์ธ์งํ๊ณ ํ๋จํ๋๋ก ๋ง๋ค๊ธฐ ์ํด์ ๊ณผ๊ฑฐ์๋ if-then์ ํ์ฉํ์ฌ ๊ตฌํํ์์ต๋๋ค. ๋์ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ์ด๋ ํด์ฃผ๋ ์ธ๊ณต์ง๋ฅ์ ๊ณผ๊ฑฐ์๋ ๊ต์ฅํ ์ฝ..
[์ ํ๋์] ํ๋ ฌ ๋ฐฉ์ ์
ํ๋ ฌ์ด๋? ํ๋ ฌ์ ํ๊ณผ ์ด์ ๊ฐ์ง๊ณ ์๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ง๋์๊ฐ์ ์์๋ณธ ๋ฒกํฐ๋ฅผ ํ์ฉํ์ฌ ํ๋ ฌ์ ํํํ ์๋ ์์ต๋๋ค. $\mathbb{R}^n$์ ์ฐจ์์ ๊ฐ์ง๋ ๋ฒกํฐ $\vec{a_1},\vec{a_2},\vec{a_3} \cdots\vec{a_n}$๊ฐ ์๋ค๊ณ ํ ๋ ๋ฒกํฐ๋ฅผ ๊ฐ ์ด๋ก ํ๋จํ๋ค๋ฉด ์๋์ ๊ฐ์ด ํํ๋ ์ ์์ต๋๋ค. $$ \mathcal{A}x =\begin{bmatrix} \vec{a_1} & \vec{a_2} & \vec{a_3} \ \dots \ \vec{a_n} \end{bmatrix} \begin{bmatrix} x_1 \\ \vdots \\ x_n \end{bmatrix} = x_1\vec{a_1} + x_2\vec{a_2} + x_3\vec{a_3} \cdots x_n\vec..
[์ ํ๋์] Vector์ linear combination
Vector์ Scalar Vector์ Scalar๋ฅผ ์๋ง ๋ฌผ๋ฆฌ์๊ฐ์ ์ฒ์ ์ ํ๋ ๊ฒ ๊ฐ์ต๋๋ค. ๋ฒกํฐ๋ ๋ฐฉํฅ๊ณผ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง๋ ๊ฐ์ด๊ณ ์ค์นผ๋ผ๋ ํฌ๊ธฐ๋ง ๊ฐ์ง๋ ๊ฐ์ด๋ผ๊ณ ๋ฐฐ์ ์ต๋๋ค. ์ด๋ฒ์๊ฐ์๋ ๋ฒกํฐ๋ฅผ ํ์ฉํ ์ ํ๋์์ ๋ํ์ฌ ๋ฐฐ์๋ณด๊ธฐ ์ํด ๋ฒกํฐ๋ฅผ ์กฐ๊ธ ๊น๊ฒ ์ดํดํ๊ณ linear combination์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค. Vector๋ $\vec{a}$๋ก ์์ ํ์ดํ๋ฅผ ์์ฑํ์ฌ ํ์ํฉ๋๋ค. ์ ํ๋์์์๋ ๋ณผ๋์ฒด๋ก ๋ฌธ์๋ฅผ ์์ฑํ์ฌ $a$์ ๊ฐ์ด ํํํ๊ธฐ๋ ํฉ๋๋ค. $\mathbb{R^2}$ ์ฐจ์์ ๋ฒกํฐ๋ผ๋ ์๋ฏธ๋ ์ค์ 2์ฐจ์์ ๋ฒกํฐ๋ฅผ ์๋ฏธํฉ๋๋ค. ๊ทธ ๋ฒกํฐ๋ ์๋์ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค. $$ \vec{a} = \begin{bmatrix}x_1 \\ x_2 \end{bmatrix} $$ ์ด ๋ฒกํฐ ๊ฐ์ ์..