본문 바로가기
카테고리 없음

R 언어 통계 분석 (데이터처리, 시각화, 회귀분석)

by maro10821 2025. 10. 29.
반응형

R 언어 이미지

 

R 언어는 통계 분석과 데이터 시각화를 전문으로 하는 프로그래밍 언어로, 전 세계 데이터 과학자, 통계학자, 연구자들이 널리 사용하고 있습니다. 풍부한 패키지 생태계와 직관적인 문법을 통해 데이터 처리부터 고급 통계 분 석, 시각화까지 폭넓은 기능을 제공합니다. 이 글에서는 R 언어를 활용한 데이터 처리, 시각화 , 회귀분석 예제를 중심으로 실무 적용법을 소개합니 다.

1. R 언어 데이터 처리 기초 – 실용적인 데이터 전처리

data <- read.csv("data.csv") 
head(data)
  • summary(), str(), names() 등으로 구조 파악
  • subset(), filter(), select(), arrange() 등으로 정제
library(dplyr) 
data %>% 
filter(Sex == "Male") %>% 
select(Age, Income) %>% 
arrange(desc(Income))

2. R 언어 통계 시각화 활용 – 데이터에 생명을 불어넣다

hist(data$Age) 
boxplot(data$Income) 
plot(data$Age, data$Income)

ggplot2 예제:

library(ggplot2) 
ggplot(data, aes(x = Age, y = Income)) + 
geom_point() + 
geom_smooth(method = "lm") + 
labs(title = "나이와 수입의 관계")
  • aes(): 시각화할 변수 지정
  • geom_*(): 그래프 유형
  • labs(), theme(): 커스터마이징

3. R 언어 회귀분석 실습 예제 – 통계 모델링의 핵심

선형 회귀:

model <- lm(Income ~ Age + Education, data = data) 
summary(model)
  • Coefficients: 변수 영향력
  • R-squared: 설명력
  • p-value: 유의성 판단

시각화:

plot(data$Age, data$Income) 
abline(model, col = "red")

로지스틱 회귀:

log_model <- glm(Survived ~ Age + Sex, data = data, family = "binomial") 
summary(log_model)

결론: R 언어는 데이터 분석의 강력한 도구

R 언어는 데이터를 정리하고, 시각화하고, 분석까지 한 번에 처리할 수 있는 통계 분석 전용 언어입니다. 실무 데이터 분석에 최적화된 도구를 찾는다면, 지금 R을 시작해보세요.

반응형

댓글