R Tips & Tricks
μ΄ κΈμ μ 리λ₯Ό μν΄ κ°μΈμ μΈ μ©λλ‘ μμ±λ ν¬μ€νΈμ λλ€. μ§μ κ³Ό μ‘°μΈμ μΈμ λ νμμ λλ€ γ γ
Basics
<-
μ=
μ μ°¨μ΄μ - μλ λμ ν¬μ€νΈ
- μμ½νλ©΄,
<-
λ=
λ λμΌν κΈ°λ₯μ νμ§λ§, μ묡μ μΌλ‘<-
λ₯Ό κΆμ₯νλ€κ³ ν¨. 그리κ³<-
λ ν λΉ μ΄ν λ³μλ₯Ό λ°ννμ§λ§,=
λ ν λΉλ§ νκ³ λ³μλ₯Ό λ°ννμ§ μμ.
- λ°μ΄ν°νλ μ νμ
names(data)
: λ°μ΄ν°νλ μμ column κ°λ€μ getdim(data)
: λ°μ΄ν°νλ μμ μ°¨μμ 리ν΄;[# rows] [# columns]
table(data$y)
: κ°μ λΆν¬λ₯Ό ν μ΄λΈμ ννλ‘ λ³΄μ¬μ€λ€.
- R λ°μ΄ν° νμ
class(obj)
λ‘ λ°μ΄ν° νμ νμΈ κ°λ₯!factor
λ μΉ΄ν κ³ λ¦¬ν λ³μcharacter
λ λ¬Έμν λ³μ //factor
λ λ€λ¦!
> table(vowel.train$y)
1 2 3 4 5 6 7 8 9 10 11
48 48 48 48 48 48 48 48 48 48 48
- Rμμμ
for
λ¬Έ
> for(i in 1:9) {
+ print(2 * i)
+ }
predict()
λ‘ λͺ¨λΈ evaluationlm()
μΌλ‘ λͺ¨λΈμ λ§λ€μμΌλ©΄predict()
λ‘ μλ‘μ΄ λ°μ΄ν°λ₯Ό λ£μ΄ Accλ₯Ό ꡬνλ€.- βλλΆ(TheBook)βλμ ν¬μ€νΈ
model <- lm(dist ~ speed, cars.train)
predict(model, newdata=cars.test)
- λ°μ΄ν°νλ μμμ
X
,y
λΆλ¦¬
X <- subset(data, select=-Salary)
y <- subset(data, select=Salary)
μ΄λ, λμμ΄ λλ μ΄μ λν΄ λ°μ΄ν(ββ)λ₯Ό λΆμ΄μ§ μμμΌ νλ€. λν, subset
ν¨μμ μΆλ ₯μ νμ DataFrameμ΄λ€!
π βνλ°μ΄ν βλμ ν¬μ€νΈ
Regression
lm(formula, data, ...)
vowel.fit <- lm(y ~., vowel.train)
References
- STHDA; Statistical Tools for High-throughput Data Analysis
R
μ μ¬μ©ν μ¬λ¬ ν΅κ³ μ κ·Όμ μΉμ νκ² μ€λͺ ν΄μ€.
- RPubs
- R μνκ³μ github κ°μ λλ.
- rdrr.io
- R package documentation
- μλ‘μ΄ R ν¨ν€μ§λ₯Ό μ΅ν λ μ μ©!!