R μ λ¬Έ
μ΄ κΈμ μ 리λ₯Ό μν΄ κ°μΈμ μΈ μ©λλ‘ μμ±λ ν¬μ€νΈμ λλ€. μ§μ κ³Ό μ‘°μΈμ μΈμ λ νμμ λλ€ γ γ
μ΄λ² νκΈ°μ λ£κ² λ <ν΅κ³μ λ°μ΄ν° λ§μ΄λ> μμ
μμ R
μΈμ΄μ λν μλμ μꡬνμ¬ νλ² κ³΅λΆν΄λ³΄κ² λμλ€. π μ¬μ€ νμ΄μ¬μ pandas
λ₯Ό μ£Όλ‘ μ°κΈ΄ νλλ°, R
λ μΈμ κ° λμμ΄ λκ² μ§β¦??
R-studio μ€μΉ
μΉκ΅¬λ‘λΆν° Docker
μ λ―Έλ΄μ λ£κ³ , Docker
λ‘ R
μ μ¨λ³Ό μ μμ§ μμκΉ νλ νΈκΈ°μ¬μ΄ μκ²Όλ€. π€© μ°Ύμ보λ R
μ ꡬλ νλ‘κ·Έλ¨μΈ R-studioλ₯Ό μ λ§λ‘ Docker
μμ λ릴 μ μμ΄μ R-studioλ₯Ό λμ»€λ‘ μ€μΉν΄ μ¬μ©νκ³ μλ€. μ€μΉλ μλμ ν¬μ€νΈλ₯Ό μ°Έκ³ νλ€.
π Dockerλ‘ RStudio Server νκ²½ μ€μΉ
λμ»€λ‘ R-studioλ₯Ό λλ¦° μ νμ μ λ§ λλ§μ‘±μ΄λ€!! λ컀, μμΌλ‘λ μμ£Ό μ¬μ©ν κ² κ°λ€ γ γ π
(p.s. μ ν¬μ€νΈμ λͺ
λ Ήμ΄μμ -d
λ‘ λ°λͺ¬ μ΅μ
μ μ€μΌ, ν둬ννΈκ° μ’
λ£λμ΄λ λμ€μ μ¬μμ ν μ μλ€!)
Rμ λ°°μ보μ!
κ²½ν¬λ μ΄μμ€ κ΅μλμ μ νλΈ κ°μ’μ λ³΄κ³ R
μΈμ΄λ₯Ό μ΅νλ€.
κ°μ’λ₯Ό ν΅ν΄ μλμ κ°μ R
ν¨ν€μ§λ€μ μ¬μ©ν΄λ³Ό μ μμλ€.
dplyr
: λ°μ΄ν°λ₯Ό μ½κ² μ μ²λ¦¬ νκ² λμμ£Όλ ν¨ν€μ§ggplot2
: λ°μ΄ν°λ₯Ό μ½κ² μκ°ν; μ°μ λ, κ·Έλν, λ°μ€ νλ‘― λ±λ±μ μ½κ² 그릴 μ μκ² λμμ£Όλ ν¨ν€μ§KoNLP
: νκ΅μ΄ NLP ν¨ν€μ§
Rλ‘ μΆλ¦¬ ν΅κ³!!
<κΈ°μ ν΅κ³>κ° <νκ· >, <νμ€νΈμ°¨> κ°μ κΈ°μ΄μ μΈ ν΅κ³λμ λν μ κ·Όμ΄λΌλ©΄, <μΆλ¦¬ ν΅κ³>λ μΆμΆν νλ³Έμμ κ° μμλ€ μ¬μ΄ κ΄κ³; Correlationλ₯Ό μ΄ν΄λ³΄κ±°λ, λͺ¨μ§λ¨μ νΉμ§μ μΆλ‘ νλ ν΅κ³λ€. R
κ°μ’μμλ μλμ°¨ μ°λΉλ₯Ό μ€μ¬μΌλ‘ 거리-μ°λΉ κ΄κ³μ λν <μ°μ λ scatter plot>λ₯Ό νμΈν΄λ³΄μλ€.
Rλ‘ ν μ€νΈ λ§μ΄λ!
Rμ KoNLP
λΌλ ν¨ν€μ§λ₯Ό μ¬μ©ν΄ κ°λ¨ν ν
μ€νΈ λ§μ΄λμ μλν΄λ³΄μλ€. μ²μμ KoNLP
μ€μΉκ° μννμ§ μμ μ΄κ³³μ ν¬μ€νΈλ₯Ό μ°Έκ³ ν΄ μ€μΉνλ€. κ·Έλ¬λ λ무 κΈ°μ΄μ μΈ μμ€μ μ€μ΅μ ν΄μ κ·Έλ°μ§ R
λ‘ νλ ν
μ€νΈ λ§μ΄λμ κ·Έλ κ² μ μ΅νμ§ μμλ€ π₯
νΈμμμ μ΅λΉλ λ¨μ΄μ λν κ·Έλνλ€. μμ½κ²λ νκ΅μ΄ μΈμ½λ©μ΄ κΉ¨μ‘λ€ π₯
Rλ‘ λ°μ΄ν° μκ°ν!!
κ·Έ μΈμ ggplot2
λ₯Ό μ΄μ©ν΄ βλ
λλ³ μ€μ§μμβμ κ·Έλνλ₯Ό 그리거λ, λ―Έκ΅ λ΄ λ²μ£μ¨ λΉλλ₯Ό μ§λλ‘ μκ°ννλ λ±μ μμ
μ R
λ‘ μ§νν΄λ³΄μλ€.
Rμ λν μΈμ
μμ μ pandas
λ₯Ό μ¬μ©ν΄λ³Έ μ μ΄ μμλλ°, R
μμλ pandas
μμλ λλ€ DataFrame
μ΄λΌλ κ°λ
μ λμΌνκ² κ°μ§κ³ μμλ€! κ·Έλμ κ·Έλ°μ§ R
μ κ°λ
λ€μ΄ κ·Έλ κ² μ΄λ ΅μ§λ μμλ€.
μ§κΈ R
μ λ°°μ°κ³ , HW λ¬Έμ λ₯Ό νλ©΄μ μμ£Ό μ°κ³ μλλ°, μκ°λ³΄λ€λ μΈλ§ν κ² κ°λ€. λ¬Όλ‘ python
κ³Ό λΉκ΅νλ©΄ νμ₯μ±μ΄ λ§μ΄ λ¨μ΄μ§μ§λ§, κ·Έλλ λ°μ΄ν°μ
μ λΆμνκ³ , ν΅κ³μ μΌλ‘ μ κ·ΌνκΈ°μλ μ¬μ ν R
μ΄ μ’μ κ² κ°λ€. λ¬Όλ‘ λμΈλ python
μ΄ λΆλͺ
νμ§λ§, μμ§ R
λ ν¨κ» λ€λ£° μ μμ΄μΌ νλ κ² κ°λ€.
λλ‘λ R
μ ν¨ν€μ§κ° μ’μ λλ μκ³ , python
μ ν¨ν€μ§κ° μ’μ λλ μμλ€. κ²°κ΅μ λ λ€ μνλκ² best μΈ κ² κ°λ€ π