์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- ์์ฐ์ด ์ฒ๋ฆฌ ๊ธฐ๋ฒ
- BoostCourse
- Python
- ์ฑ์งํผํฐ์ ์ ๋ฌด์๋ํ
- list
- inplace=True
- ์คํ์ ๋ฐฐ์ด ํธ์ํ๊ธฐ
- Bag-of-Words
- ์์ฐ์ด ์ฒ๋ฆฌ์ ๋ชจ๋ ๊ฒ
- ๋ ผ๋ฌธ์ด๋ก
- ๋ฐ์ดํฐ ์๊ฐํ
- ๋น์ ๊ณต์ ๋น ๋ถ๊ธฐ ํฉ๊ฒฉ
- sklearn.ensemble
- SQLD ๋ฒผ๋ฝ์น๊ธฐ
- interpolate()
- sqld
- C++
- Til
- head()
- llm
- DeepSpeed
- Collection if
- ์์ด๋ฆฌํฌ
- tail()
- ๋ฐ์ดํฐ ๊ฒฐ์ธก์น
- AI
- ํ์ธํ๋ ๋ฉ๋ชจ๋ฆฌ ํด๊ฒฐ
- colab
- pytorch zero to all
- Naive Bayes Classifier for Document Classification
- Today
- Total
๋ชฉ๋กBag-of-Words (1)
hyerong's Dev_world๐ก
์ฑํฐ 1์ 2๊ฐ : ๊ธฐ์กด ์์ฐ์ด ์ฒ๋ฆฌ ๊ธฐ๋ฒ ์๊ฐ ํต์ฌ ๋จ์ด : BOW, ์ํซ ๋ฒกํฐ, ๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ, ๋ฌธ์ฅ ๋ถ๋ฅ Bag-Of-Words (๋จ์ด ๊ฐ๋ฐฉ ๋ชจํ) ๋จ์ด ์์ ๊ณ ๋ ค X, ๊ฐ ๋จ์ด๋ค์ ์ถํ ๋น๋(frequency)์๋ง ์ง์คํ๋ ๋ฌธ์ํ ๋ฐ์ดํฐ์ ์์นํ ํํ ๋ฐฉ๋ฒ ๋จ์ด๋ฅผ ๋ฒกํฐ๋ก ํํํ๊ธฐ ์ํด์๋ ์ฃผ์ด์ง ๋ฌธ์ฅ์ ์ฐ์ธ ๋จ์ด๋ค์ ์ฌ์ (Vocabulary(key-value) ํํ๋ก ์ ์ฅ(์ค๋ณต ํ์ฉ X) ์ ์ฅ๋ ๋จ์ด๋ค์ ๊ฐ๊ฐ ์ ๋ํฌํ ์นดํ ๊ณ ๋ฆฌ ๋ณ์(Categorical variable)์ด๋ฏ๋ก, ์-ํซ ์ธ์ฝ๋ฉ(One-hot Encoding)๋ฅผ ์ด์ฉํด ๋ฒกํฐ๋ก ํํํ ์ ์๊ณ -> ๊ฒฐ๊ตญ ์ฃผ์ด์ง ๋ฌธ์ฅ์ ์-ํซ ๋ฒกํฐ์ ํฉ, ์ฆ ์ซ์๋ก ํํ(numericalํ๊ฒ) ๊ฐ๋ฅ ๋ฌธ์ฅ์ ๊ตฌ์ฑํ๊ณ ์๋ ๋จ์ด๋ค์ ๊ฐ๋ฐฉ์ ์์ฐจ์ ์ผ๋ก..