R Tips & Tricks
μ΄ κΈμ μ 리λ₯Ό μν΄ κ°μΈμ μΈ μ©λλ‘ μμ±λ ν¬μ€νΈμ λλ€. μ§μ κ³Ό μ‘°μΈμ μΈμ λ νμμ λλ€ γ γ
Basics
<-μ=μ μ°¨μ΄μ - μλ λμ ν¬μ€νΈ
- μμ½νλ©΄,
<-λ=λ λμΌν κΈ°λ₯μ νμ§λ§, μ묡μ μΌλ‘<-λ₯Ό κΆμ₯νλ€κ³ ν¨. 그리κ³<-λ ν λΉ μ΄ν λ³μλ₯Ό λ°ννμ§λ§,=λ ν λΉλ§ νκ³ λ³μλ₯Ό λ°ννμ§ μμ.
- λ°μ΄ν°νλ μ νμ
names(data): λ°μ΄ν°νλ μμ column κ°λ€μ getdim(data): λ°μ΄ν°νλ μμ μ°¨μμ 리ν΄;[# rows] [# columns]table(data$y): κ°μ λΆν¬λ₯Ό ν μ΄λΈμ ννλ‘ λ³΄μ¬μ€λ€.
- R λ°μ΄ν° νμ
class(obj)λ‘ λ°μ΄ν° νμ νμΈ κ°λ₯!factorλ μΉ΄ν κ³ λ¦¬ν λ³μcharacterλ λ¬Έμν λ³μ //factorλ λ€λ¦!
> table(vowel.train$y)
1 2 3 4 5 6 7 8 9 10 11
48 48 48 48 48 48 48 48 48 48 48
- Rμμμ
for문
> for(i in 1:9) {
+ print(2 * i)
+ }
predict()λ‘ λͺ¨λΈ evaluationlm()μΌλ‘ λͺ¨λΈμ λ§λ€μμΌλ©΄predict()λ‘ μλ‘μ΄ λ°μ΄ν°λ₯Ό λ£μ΄ Accλ₯Ό ꡬνλ€.- βλλΆ(TheBook)βλμ ν¬μ€νΈ
model <- lm(dist ~ speed, cars.train)
predict(model, newdata=cars.test)
- λ°μ΄ν°νλ μμμ
X,yλΆλ¦¬
X <- subset(data, select=-Salary)
y <- subset(data, select=Salary)
μ΄λ, λμμ΄ λλ μ΄μ λν΄ λ°μ΄ν(ββ)λ₯Ό λΆμ΄μ§ μμμΌ νλ€. λν, subset ν¨μμ μΆλ ₯μ νμ DataFrameμ΄λ€!
π βνλ°μ΄ν βλμ ν¬μ€νΈ
Regression
lm(formula, data, ...)
vowel.fit <- lm(y ~., vowel.train)
References
- STHDA; Statistical Tools for High-throughput Data Analysis
Rμ μ¬μ©ν μ¬λ¬ ν΅κ³ μ κ·Όμ μΉμ νκ² μ€λͺ ν΄μ€.
- RPubs
- R μνκ³μ github κ°μ λλ.
- rdrr.io
- R package documentation
- μλ‘μ΄ R ν¨ν€μ§λ₯Ό μ΅ν λ μ μ©!!