이 글은 정리λ₯Ό μœ„ν•΄ 개인적인 μš©λ„λ‘œ μž‘μ„±λœ ν¬μŠ€νŠΈμž…λ‹ˆλ‹€. 지적과 쑰언은 μ–Έμ œλ‚˜ ν™˜μ˜μž…λ‹ˆλ‹€ γ…Žγ…Ž

2 minute read

이 글은 정리λ₯Ό μœ„ν•΄ 개인적인 μš©λ„λ‘œ μž‘μ„±λœ ν¬μŠ€νŠΈμž…λ‹ˆλ‹€. 지적과 쑰언은 μ–Έμ œλ‚˜ ν™˜μ˜μž…λ‹ˆλ‹€ γ…Žγ…Ž


Basics

  • <-와 =의 차이점
    • μžλ‹ˆ λ‹˜μ˜ 포슀트
    • μš”μ•½ν•˜λ©΄, <-λ‚˜ =λ‚˜ λ™μΌν•œ κΈ°λŠ₯을 ν•˜μ§€λ§Œ, μ•”λ¬΅μ μœΌλ‘œ <-λ₯Ό ꢌμž₯ν•œλ‹€κ³  함. 그리고 <-λŠ” ν• λ‹Ή 이후 λ³€μˆ˜λ₯Ό λ°˜ν™˜ν•˜μ§€λ§Œ, =λŠ” ν• λ‹Ήλ§Œ ν•˜κ³  λ³€μˆ˜λ₯Ό λ°˜ν™˜ν•˜μ§€ μ•ŠμŒ.
  • λ°μ΄ν„°ν”„λ ˆμž„ νŒŒμ•…
    • names(data): λ°μ΄ν„°ν”„λ ˆμž„μ˜ column 값듀을 get
    • dim(data): λ°μ΄ν„°ν”„λ ˆμž„μ˜ 차원을 리턴; [# rows] [# columns]
    • table(data$y): κ°’μ˜ 뢄포λ₯Ό ν…Œμ΄λΈ”μ˜ ν˜•νƒœλ‘œ 보여쀀닀.
  • R 데이터 νƒ€μž…
    • class(obj)둜 데이터 νƒ€μž… 확인 κ°€λŠ₯!
    • factorλŠ” μΉ΄ν…Œκ³ λ¦¬ν˜• λ³€μˆ˜
    • characterλŠ” λ¬Έμžν˜• λ³€μˆ˜ // factorλž‘ 닀름!
> table(vowel.train$y)

 1  2  3  4  5  6  7  8  9 10 11
48 48 48 48 48 48 48 48 48 48 48
  • Rμ—μ„œμ˜ forλ¬Έ
> for(i in 1:9) {
+   print(2 * i)
+ }
model <- lm(dist ~ speed, cars.train)
predict(model, newdata=cars.test)
  • λ°μ΄ν„°ν”„λ ˆμž„μ—μ„œ X, y 뢄리
X <- subset(data, select=-Salary)
y <- subset(data, select=Salary)

μ΄λ•Œ, λŒ€μƒμ΄ λ˜λŠ” 열에 λŒ€ν•΄ λ”°μ˜΄ν‘œ(β€œβ€œ)λ₯Ό 뢙이지 μ•Šμ•„μ•Ό ν•œλ‹€. λ˜ν•œ, subset ν•¨μˆ˜μ˜ 좜λ ₯은 항상 DataFrame이닀!

πŸ‘‰ β€˜ν›ˆλ°μ΄ν…€β€™λ‹˜μ˜ 포슀트

Regression

lm(formula, data, ...)

vowel.fit <- lm(y ~., vowel.train)

References

  • STHDA; Statistical Tools for High-throughput Data Analysis
    • R을 μ‚¬μš©ν•œ μ—¬λŸ¬ 톡계 접근을 μΉœμ ˆν•˜κ²Œ μ„€λͺ…ν•΄μ€Œ.
  • RPubs
    • R μƒνƒœκ³„μ˜ github 같은 λŠλ‚Œ.
  • rdrr.io
    • R package documentation
    • μƒˆλ‘œμš΄ R νŒ¨ν‚€μ§€λ₯Ό 읡힐 λ•Œ 유용!!

Updated: