์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Bag-of-Words
- pytorch zero to all
- head()
- inplace=True
- SQLD ๋ฒผ๋ฝ์น๊ธฐ
- ๋น์ ๊ณต์ ๋น ๋ถ๊ธฐ ํฉ๊ฒฉ
- DeepSpeed
- ๋ฐ์ดํฐ ์๊ฐํ
- ๋ฐ์ดํฐ ๊ฒฐ์ธก์น
- llm
- ์ฑ์งํผํฐ์ ์ ๋ฌด์๋ํ
- Naive Bayes Classifier for Document Classification
- ๋ ผ๋ฌธ์ด๋ก
- Til
- AI
- interpolate()
- list
- Python
- ์์ฐ์ด ์ฒ๋ฆฌ ๊ธฐ๋ฒ
- sqld
- Collection if
- ์คํ์ ๋ฐฐ์ด ํธ์ํ๊ธฐ
- sklearn.ensemble
- C++
- ์์ด๋ฆฌํฌ
- BoostCourse
- ํ์ธํ๋ ๋ฉ๋ชจ๋ฆฌ ํด๊ฒฐ
- ์์ฐ์ด ์ฒ๋ฆฌ์ ๋ชจ๋ ๊ฒ
- colab
- tail()
- Today
- Total
๋ชฉ๋ก๋ฐ์ดํฐ ๊ฒฐ์ธก์น (2)
hyerong's Dev_world๐ก

ํ์ด์ฌ์ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํ๋ ๊ณผ์ ์์ ๋ฐ์ดํฐ ๊ฒฐ์ธก์น(missing data)๋ฅผ ๋ง๋ฌ์๋ ํด๊ฒฐ๋ฐฉ๋ฒ 2๊ฐ์ง๋ฅผ ์๊ฐํ๋ค. ์ฒซ๋ฒ์งธ๋ ๊ฒฐ์ธก์น์ ๋ํด ๋ฐ์ดํฐ์ ํ๊ท ๊ฐ์ผ๋ก ๋ฉ๊พธ๋ ๋ฐฉ๋ฒ ๋๋ฒ์ฌ๋ ๋ณด๊ฐ๋ฒ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋จผ์ ๊ฒฐ์ธก์น์ ๊ฐ๋ ์ ๋ค์ ์ง์ด๋ณด์๋ฉด missing data ์ฆ, ์์ด๋ฒ๋ฆฐ ๋ฐ์ดํฐ, ๋ฐ์ดํฐ๊ฐ ๋ด๊ธด ํ์์, ํ์ ๋ํด ๋ฐ์ดํฐ ๊ฐ์ ๋ฃ๋ ์ด์ด ๋น์ด์๋ค๊ณ ์๊ฐํ๋ฉด ๋๋ค. ์๋ฅผ ๋ค์ด, ํ์๋ค์ ํ๋ฒ์ด๋ผ๋ ํ์์ ํน์ ํ์์ ํ๋ฒ ์นธ์ด ๋น์ด์ ธ ์๋ค๊ณ ์๊ฐํ๋ฉด ๋๋ค. ์ด๋ฆ ํ๋ฒ ํ๊ธธ๋ 21900123 ์ฌ์ฒญ์ด (missing data) ๋ก๋นํ 21500321 ์ ํ์์๋ ์ฌ์ฒญ์ด์ ํ๋ฒ์์ ๋ฐ์ดํฐ missing์ด ๋ฐ์ํ๋ค. ์ด๋ฐ ๋น ๋ฐ์ดํฐ๊ฐ ์์๊ฐ๋ด ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๊ฑฐ์น๋ ๊ฒ์ด๋ค. ํ๋ก๊ทธ๋๋จธ๋ ์ด๋ฐ..

ํ์ด์ฌ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ฝ์ด์ฌ๋ ์ฃผ๋ก colab์ ์ฌ์ฉํ๋ ํธ์ด๋ค. ์น์ด๋ผ ์ ๊ทผ์ฑ๋ ํธํ๊ณ ๋๊ณ ํค๊ธฐ ํธํ๊ณ ๊ฐ๋ฒผ์ด ๋๋. 1. read_csv ์์ ์ด๋ ๋ค์ํ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ฌ๋ read_csv๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ์ ธ์จ๋ค ๋จผ์ import๋ก ํ๋ค๋ ์ธ์ฌํ๋ฉด ๋ฐ์ดํฐ ๋ฐ์ ๊ฐ์ฒด์ read_csv('ํ์ผ ์ด๋ฆ.ํ์ฅ์')๋ฅผ ๋์ ํด์ฃผ๋ฉด๋๋ค. 2. ๋ฐ์ดํฐ ๊ฒฐ์ธก์น ํ์ธ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ผ๋ฉด ๋ฐ์ดํฐ ๊ฒฐ์ธก์น๋ฅผ ํ์ธํด์ผํ๋ค๋ ๋ง์ด ์๋ค. ๋ฐ์ดํฐ๊ฐ ๋น๊ฒ ์๋์ง ์๋์ง ์์๋ณด๋ ๊ฒ์ด๋ค. ๊ณ๋ ํํ ์ฌ๊ธฐ์ 30๊ฐ๊ฐ ๋ค ์๋์ง ํ์ธํ๋ ๋๋์ด๋๊น? ์์ด๋ก Missing Value๋ผ๊ณ ํ๋ค. ์ค์ฌ์ NA๋ผ๊ณ ๋ ํ๋๋ฐ null์ด๋ผ๊ณ ์๊ฐํ๋ฉด ์ฝ๋ค. ํ๋ค๋ NaN์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. ๋ฉ์๋๋ ์ฝ๊ฒ ๊ธฐ์ตํ ์ ์๋ค. isnull()์ด๋ค. ๋ฌธ์ ๊ทธ๋๋ก is ..