R에서 SVM(서포트 벡터 머신) (svm())

안녕하세요! R을 이용해서 데이터 분석하는 재미에 푹 빠져계신가요? 저도 그래요! 요즘 머신러닝 기법 중에서 강력한 성능으로 인기를 끌고 있는 SVM, 즉 서포트 벡터 머신에 대해 알아보고 싶어서 좀 공부해봤어요. R에서 svm() 함수를 활용하는 방법을 함께 익혀보면 좋을 것 같아서 이렇게 글을 쓰게 됐어요. SVM이 뭔지, 어떻게 작동하는지 궁금하시죠? R에서 svm() 함수는 어떻게 사용하는지, 모델 성능은 … Read more

R에서 랜덤 포레스트 (randomForest())

안녕하세요, 여러분! 👋 오늘 함께 알아볼 주제는 바로 랜덤 포레스트(randomForest)에요! 혹시 나무를 보면서 숲을 못 본다는 말, 들어보셨나요? 데이터 분석에서도 마찬가지인 경우가 많아요. 수많은 데이터 속에서 의미있는 정보를 찾아내는 건 마치 울창한 숲에서 길을 찾는 것만큼 어려울 수 있죠. 하지만 걱정 마세요! 오늘 우리에게는 든든한 길잡이가 있답니다. 바로 R의 randomForest() 함수를 활용한 랜덤 포레스트 기법이에요. … Read more

R에서 의사결정 나무 (rpart(), rpart.plot())

안녕하세요! 오늘은 데이터 분석에서 핫한 알고리즘 중 하나, 바로 의사결정 나무에 대해 같이 알아보는 시간을 가져보려고 해요. 마치 나무가 가지를 뻗어 나가듯 데이터를 분석하는 재미있는 방법이랍니다. R 언어의 강력한 도구인 rpart() 함수와 예쁜 시각화를 위한 rpart.plot() 함수를 활용하면, 복잡한 데이터도 쉽고 직관적으로 이해할 수 있어요. 궁금하시죠? 어려운 이론보다는 실제 데이터를 가지고 예시를 보여드릴 테니 걱정 … Read more

R에서 선형 회귀 모델 (lm())

안녕하세요! 데이터 분석에 관심 있는 분들, 모두 환영해요! 🤗 오늘은 R을 이용해서 선형 회귀 모델을 만들어보는 방법에 대해 알아보려고 해요. R에서 선형 회귀 모델하면 왠지 어렵게 느껴지시나요? 걱정 마세요! 제가 오늘 lm() 함수 사용법부터 차근차근 설명해 드릴게요. 선형 회귀 모델의 기본 원리를 이해하고 나면, 모델 평가 및 해석하는 것도 훨씬 쉬워질 거예요. 실제 데이터 적용 … Read more

R에서 데이터 분할 (train_test_split() 대신 sample())

안녕하세요, 여러분! 데이터 분석을 하다 보면 항상 마주치는 중요한 단계, 바로 데이터 분할에 대해 이야기해보려고 해요. R에서 머신러닝 모델을 만들 때 흔히 `train_test_split()` 함수를 많이 사용하시죠? 저도 그랬어요! 하지만 오늘은 좀 더 자유롭게 데이터를 다룰 수 있는 `sample()` 함수를 소개해 드리려고 합니다. `sample()` 함수를 이용하면 `train_test_split()`보다 더욱 유연하게 데이터 샘플링을 할 수 있어요. 데이터 샘플링의 … Read more

R에서 머신러닝 패키지 (caret, randomForest, e1071)

안녕하세요! 😊 요즘 데이터 분석, 머신러닝 핫하잖아요. 그래서 오늘은 R 언어로 머신러닝을 시작하는 분들에게 정말 유용한 caret, randomForest, e1071 패키지에 대해 같이 알아보려고 해요! 머신러닝, 어렵게 느껴지셨다면 이제 걱정 뚝! 🤗 복잡한 알고리즘들을 간편하게 사용할 수 있도록 도와주는 패키지들이거든요. 특히 caret 패키지는 여러 머신러닝 알고리즘을 한 번에 비교하고, 최적의 모델을 찾아주는 마법같은 기능을 제공한답니다. randomForest는 … Read more

R에서 정규성 검정 (shapiro.test(), qqnorm())

안녕하세요! 데이터 분석을 하다 보면 “내 데이터가 정규분포를 따르는 걸까?” 하는 궁금증, 한 번쯤은 가져보셨을 거예요. 특히 통계 검정을 할 때 정규성 가정이 중요한 경우가 많아서 꼭 확인해야 할 부분이기도 하고요. 그래서 오늘은 R을 이용해서 데이터의 정규성을 검정하는 방법을 같이 알아보려고 해요! 샤피로-윌크 검정(Shapiro-Wilk test)과 QQ 그림을 통해 정규성을 어떻게 판단하는지, 그리고 실제 데이터에 적용하면 … Read more

R에서 상관 분석 (cor(), cor.test())

안녕하세요! 데이터 분석에 관심 있는 분들, 모두 환영해요! 😊 오늘 우리 같이 재미난 통계 이야기 하나 나눠볼까요? 바로 ‘상관 분석‘이라는 건데요, 어렵게 생각하지 마세요! R을 이용해서 쉽고 간편하게 상관 분석 하는 법, 제가 차근차근 알려드릴게요. 혹시 두 변수 사이에 어떤 관계가 있을지 궁금했던 적 있나요? 예를 들어 아이스크림 판매량과 날씨의 관계처럼요. ☀️🍦 R의 `cor()` 함수와 … Read more

R에서 카이제곱 검정 (chisq.test())

안녕하세요! 오늘은 데이터 분석에서 빼놓을 수 없는 중요한 친구, 바로 카이제곱 검정(chisq.test())에 대해 함께 알아보려고 해요. 뭔가 이름부터 어려워 보인다고요? 걱정 마세요! 차근차근 설명해 드릴 테니, 편안한 마음으로 따라오시면 돼요. 데이터 분석을 하다 보면 변수들 간에 어떤 관계가 있는지 궁금할 때가 많잖아요. 특히 범주형 변수, 예를 들면 성별이나 선호하는 색깔 같은 변수들 사이의 연관성을 분석할 … Read more

R에서 회귀 분석 (lm(), summary())

안녕하세요! 데이터 분석에 관심 있는 분들, 모두 환영해요! 🤗 오늘은 R을 이용해서 회귀 분석하는 방법을 같이 알아보려고 해요. R은 정말 강력한 통계 분석 도구인데, 특히 `lm()` 함수와 `summary()` 함수를 이용하면 회귀 분석을 아주 쉽게 할 수 있답니다. 데이터 분석 초보라도 걱정하지 마세요! 제가 최대한 쉽고 재밌게 설명해 드릴게요. 😉 회귀 분석의 기본 개념부터 `lm()` 함수 … Read more