๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๊ฐ•์˜๋ฆฌ๋ทฐ๐Ÿ–ฅ๏ธ

[boostcourse][์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์˜ ๋ชจ๋“ ๊ฒƒ] ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ํ™œ์šฉ ๋ถ„์•ผ์™€ ํŠธ๋ Œ๋“œ

by hyerong 2024. 1. 24.

 

boostcourse๋ฅผ ํ†ตํ•ด KAIST ์ฃผ์žฌ๊ฑธ ๊ต์ˆ˜๋‹˜์˜ "์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์˜ ๋ชจ๋“  ๊ฒƒ" ๊ฐ•์˜๋ฅผ ๋“ฃ๊ฒŒ ๋˜์—ˆ๋‹ค. 

์š”์ฆ˜ ์—ฐ๊ตฌ์‹ค์—์„œ ๊ณต๋ถ€ํ•˜๊ฒŒ ๋œ ๋ถ„์•ผ๊ฐ€ ์–ธ์–ด๋ชจ๋ธ์ธ๋ฐ, ์–ธ์–ด๋ชจ๋ธ์— ๋“ค์–ด๊ฐ€๊ธฐ์— ์•ž์„œ์„œ ๋”ฅ๋Ÿฌ๋‹๊ณผ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๊ณต๋ถ€๋ฅผ ์‹œ์ž‘ํ•ด์•ผํ•ด์„œ ๋ฌด๋ฃŒ ๊ฐ•์˜๋ฅผ ์„œ์น˜ํ•˜๋‹ค๊ฐ€ ์•Œ๊ฒŒ ๋˜์—ˆ๋‹ค. 

 

์ฒซ๋ฒˆ์งธ ๊ฐ•์˜๋Š” "์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ํ™œ์šฉ ๋ถ„์•ผ์™€ ํŠธ๋ Œ๋“œ"์˜€๋Š”๋ฐ, ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๊ฐ€ ๋ฌด์—‡์ธ์ง€๋ฟ ์•„๋‹ˆ๋ผ ๊ธฐ์ˆ ์ด ํ™œ์šฉ๋˜๋Š” ๋ถ„์•ผ์™€ ๊ด€๋ จ ํ•™ํšŒ๊นŒ์ง€ ์•Œ์•„๋ณด๋‹ˆ ์•ž์œผ๋กœ์ด ํ•™์Šต์— ํฐ ๋™๊ธฐ๋ถ€์—ฌ๊ฐ€ ๋˜์—ˆ๋‹ค. ํŠนํžˆ ํ…์ŠคํŠธ ๋งˆ์ด๋‹ ๊ธฐ์ˆ ์—์„œ computational social science(๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ๋ฐ˜ ์‚ฌํšŒ๊ณผํ•™)๊ฐ€ ๋‚˜์™€ ์ •๋ง ์ž˜ ๋งž์„ ๊ฒƒ ๊ฐ™๋‹ค๋Š” ์ƒ๊ฐ์ด ๋“ค์–ด ์•ž์œผ๋กœ์˜ ๊ณต๋ถ€ํ•  ๋ถ„์•ผ์— ๋Œ€ํ•œ ๊ธฐ๋Œ€๊ฐ€ ํฌ๋‹ค. 

 

๊ฐ•์˜ ํ”ผํ”ผํ‹ฐ๋Š” ๊ตฌํ•  ์ˆ˜ ์—†์ง€๋งŒ, ์š”์•ฝ๋œ ๋‚ด์šฉ์ด ํ•จ๊ป˜ ๊ณต์œ ๋˜์–ด ๋ณต์Šตํ•  ๋•Œ ์ฐธ๊ณ ํ•ด์•ผ๊ฒ ๋‹ค. 


์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ถ„์•ผ๋ณ„ ํ•™ํšŒ ๋ชฉ๋ก

1. Natural language processing (์ž์—ฐ์–ด ์ฒ˜๋ฆฌ)

  • ์ฃผ์š” ํ•™ํšŒ : ACL, EMNLP, NAACL
  • ํ•™๋ฌธ ๋ถ„์•ผ
    • Low-level parsing : Tokenization, stemming
    • Word and phrase level : NER(Named Entity Recognation), POS(Part-Of-Speech) tagging
    • Sentence level : ๊ฐ์„ฑ ๋ถ„๋ฅ˜(Sentiment Analysis), ๊ธฐ๊ณ„ ๋ฒˆ์—ญ(Machine Translation)
    • Multi-sentence and paragraph level : ๋…ผ๋ฆฌ์  ๋‚ดํฌ ๋ฐ ๋ชจ์ˆœ๊ด€๊ณ„ ์˜ˆ์ธก(Entailment Prediction),
      ๋…ํ•ด๊ธฐ๋ฐ˜ ์งˆ์˜์‘๋‹ต(question answering), ์ฑ—๋ด‡(dialog systems), ์š”์•ฝ(summarization)

 

2. Text mining (ํ…์ŠคํŠธ ๋งˆ์ด๋‹)

  • ์ฃผ์š” ํ•™ํšŒ : KDD, The WebConf(ๅ‰ WWW), WSDM, CIKM, ICWSM
  • ํ•™๋ฌธ ๋ถ„์•ผ
    • Extract useful information and insights from text and document data
    • ๋ฌธ์„œ ๊ตฐ์ง‘ํ™”(Document clustering)      ex) ํ† ํ”ฝ ๋ชจ๋ธ๋ง
    • Highly related to computational social science : ํ†ต๊ณ„์ ์œผ๋กœ ์‚ฌํšŒ๊ณผํ•™์  ์ธ์‚ฌ์ดํŠธ ์‚ฐ์ถœ

 

3. Information retrieval (์ •๋ณด ๊ฒ€์ƒ‰)

  • ์ฃผ์š” ํ•™ํšŒ : SIGIR, WSDM, CIKM, Recsys
  • ํ•™๋ฌธ ๋ถ„์•ผ
    • Highly related to computational social science
    • ์ •๋ณด ๊ฒ€์ƒ‰ ๋ถ„์•ผ, ์ถ”์ฒœ ์‹œ์Šคํ…œ

 

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ถ„์•ผ์˜ ํŠธ๋ Œ๋“œ

  • ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ถ„์•ผ : CV ํ˜น์€ ์˜์ƒ์ฒ˜๋ฆฌ ๋ถ„์•ผ์™€ ๋”๋ถˆ์–ด AI์™€ DL๊ธฐ์ˆ ์ด ๊ฐ€์žฅ ํ™œ๋ฐœํžˆ ์ ์šฉ๋˜๋ฉฐ ๊พธ์ค€๋น„ ๋ฐœ์ „ํ•˜๋Š” ๋ถ„์•ผ ์ค‘ ํ•˜๋‚˜์ž„.
    ๊ธฐ์กด ML๊ณผ DL ๊ธฐ์ˆ ๋กœ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ฃผ์–ด์ง„ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆซ์ž๋กœ ๋ณ€ํ™˜ํ•˜๋Š”
    '์›Œ๋“œ ์ž„๋ฒ ๋”ฉ(Word Embedding)' ๊ณผ์ •์„ ๊ฑฐ์น˜๊ฒŒ ๋œ๋‹ค. 


  • ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋Š” ๋ฌธ์žฅ์„ ๊ตฌ์„ฑํ•˜๋Š” ์ˆœ์„œ ์ •๋ณด๊ฐ€ ์ค‘์š”ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ๋ฐ›์•„๋“ค์ผ ์ˆ˜ ์žˆ๋Š” ํŠนํ™” ๋ชจ๋ธ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ–ˆ๊ณ ,
    ๊ทธ ๋Œ€ํ‘œ์ ์ธ ์˜ˆ๋กœ๋Š” 'RNN(Recurrent Neural Network)'์ด ์žˆ๋‹ค. 
    ์ดํ›„ ๋‹จ์ ์„ ๋ณด์™„ํ•œ LSTM, GRU ๋ชจ๋ธ์ด ๋‚˜์™€ ์‚ฌ์šฉ๋จ. 


  • 2017๋…„์—๋Š” ๊ตฌ๊ธ€์—์„œ ๋ฐœํ‘œํ•œ 'Attention is all YOU need' (์ฒจ๋ถ€ํŒŒ์ผ) ๋ผ๋Š” ์ œ๋ชฉ์˜ ๋…ผ๋ฌธ์ด ๋‚˜์˜ค๋ฉด์„œ '์…€ํ”„ ์–ดํ…์…˜(Self-Attention)' ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ 'ํŠธ๋žœ์Šคํฌ๋จธ(Transformer) ๋ชจ๋ธ'์ด ๊ฐ๊ด‘๋ฐ›๊ธฐ ์‹œ์ž‘ํ–ˆ๋‹ค.
    ์ตœ๊ทผ ๋ฐœํ‘œ๋œ ๋Œ€๋ถ€๋ถ„์˜ ๋ชจ๋ธ๋“ค์€ ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ๊ฒƒ์ด ๋งŽ์œผ๋ฉฐ, ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ์€ ์ฃผ๋กœ ์‚ฌ์šฉ๋˜๋˜ '๊ธฐ๊ณ„ ๋ฒˆ์—ญ' ๋ถ„์•ผ๋ฅผ ๋„˜์–ด ํ˜„์žฌ๋Š” ์˜์ƒ/์‹ ์•ฝ๊ฐœ๋ฐœ/์‹œ๊ณ„์—ด ์˜ˆ์ธก ๋“ฑ์—์„œ๋„ ๋‹ค์–‘ํ•˜๊ฒŒ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ์Œ. 
  • ์ตœ๊ทผ ์œ ํ–‰ ๋ชจ๋ธ๋กœ๋Š” ์ž๊ฐ€์ง€๋„ ํ•™์Šต(self-supervised Learning)์ด ๊ฐ€๋Šฅํ•œ BERT, GPT ๋“ฑ์ด ์žˆ๋‹ค. 

Attention is all you need ์ดˆ๋ก ๋ณด๋Ÿฌ๊ฐ€๊ธฐ