R에서 워드 클라우드 만들기 (wordcloud 패키지 활용)

안녕하세요! 데이터 시각화, 생각만 해도 뭔가 멋있지 않나요? 오늘은 R을 이용해서 멋진 워드 클라우드를 만드는 방법을 함께 알아보려고 해요. 마치 마법처럼 단어들이 둥실둥실 떠다니는 모습, 상상만 해도 신기하지 않나요? 데이터 분석 결과를 한눈에 보여주는 워드 클라우드는 프레젠테이션이나 보고서에 활용하기에도 정말 좋답니다. R의 wordcloud 패키지를 이용하면 어렵지 않게 만들 수 있어요. 복잡한 코딩은 잠시 잊고, 저와 … Read more

R에서 텍스트 데이터를 다루는 방법 (tm, tidytext 패키지 활용)

안녕하세요! 데이터 분석, 특히 텍스트 분석에 관심 있는 분들 환영해요! 요즘 텍스트 데이터 분석이 정말 핫하죠? 저도 공부하면서 늘 헷갈렸던 부분이 있는데, 바로 R에서 텍스트 데이터를 어떻게 다뤄야 하는지였어요. 그래서 오늘 여러분과 함께 텍스트 데이터 전처리 과정부터 tm 패키지, 그리고 tidytext 패키지 활용법까지 차근차근 알아보려고 합니다. 특히 tm 패키지와 tidytext 패키지를 비교하며 실제 분석 예시까지 … Read more

R에서 PCA(주성분 분석) (prcomp())

안녕하세요! 데이터 분석의 세계에 오신 여러분 환영해요! 😄 오늘 우리 같이 재밌는 분석 기법을 하나 탐험해볼까요? 바로 데이터 차원 축소의 마법사, 주성분 분석(PCA)입니다! 복잡한 데이터를 좀 더 단순하고 이해하기 쉽게 만들어주는 PCA, R에서는 `prcomp()` 함수를 이용해서 간편하게 수행할 수 있답니다. 궁금하시죠? 데이터 속에 숨겨진 주요 정보들을 쏙쏙 뽑아내는 PCA의 세계, 함께 여행을 떠나보자구요! 어렵게 생각하지 … Read more

R에서 k-means 군집 분석 (kmeans())

안녕하세요! 데이터 분석의 세계에 오신 걸 환영해요! 오늘 함께 탐험해 볼 주제는 바로 k-means 군집 분석이에요. 데이터 속에 숨겨진 패턴과 그룹을 찾아내는 데 마법처럼 활용되는 흥미로운 기법이죠. R 언어의 kmeans() 함수를 이용해서 어떻게 이 마법을 부릴 수 있는지 같이 알아볼 거예요. 복잡한 데이터도 보기 좋게 정리하고 싶으셨던 분들, 데이터 분석 초보라 걱정되시는 분들, 모두 환영합니다! … Read more

R에서 SVM(서포트 벡터 머신) (svm())

안녕하세요! R을 이용해서 데이터 분석하는 재미에 푹 빠져계신가요? 저도 그래요! 요즘 머신러닝 기법 중에서 강력한 성능으로 인기를 끌고 있는 SVM, 즉 서포트 벡터 머신에 대해 알아보고 싶어서 좀 공부해봤어요. R에서 svm() 함수를 활용하는 방법을 함께 익혀보면 좋을 것 같아서 이렇게 글을 쓰게 됐어요. SVM이 뭔지, 어떻게 작동하는지 궁금하시죠? R에서 svm() 함수는 어떻게 사용하는지, 모델 성능은 … Read more

R에서 랜덤 포레스트 (randomForest())

안녕하세요, 여러분! 👋 오늘 함께 알아볼 주제는 바로 랜덤 포레스트(randomForest)에요! 혹시 나무를 보면서 숲을 못 본다는 말, 들어보셨나요? 데이터 분석에서도 마찬가지인 경우가 많아요. 수많은 데이터 속에서 의미있는 정보를 찾아내는 건 마치 울창한 숲에서 길을 찾는 것만큼 어려울 수 있죠. 하지만 걱정 마세요! 오늘 우리에게는 든든한 길잡이가 있답니다. 바로 R의 randomForest() 함수를 활용한 랜덤 포레스트 기법이에요. … Read more

R에서 의사결정 나무 (rpart(), rpart.plot())

안녕하세요! 오늘은 데이터 분석에서 핫한 알고리즘 중 하나, 바로 의사결정 나무에 대해 같이 알아보는 시간을 가져보려고 해요. 마치 나무가 가지를 뻗어 나가듯 데이터를 분석하는 재미있는 방법이랍니다. R 언어의 강력한 도구인 rpart() 함수와 예쁜 시각화를 위한 rpart.plot() 함수를 활용하면, 복잡한 데이터도 쉽고 직관적으로 이해할 수 있어요. 궁금하시죠? 어려운 이론보다는 실제 데이터를 가지고 예시를 보여드릴 테니 걱정 … Read more

R에서 선형 회귀 모델 (lm())

안녕하세요! 데이터 분석에 관심 있는 분들, 모두 환영해요! 🤗 오늘은 R을 이용해서 선형 회귀 모델을 만들어보는 방법에 대해 알아보려고 해요. R에서 선형 회귀 모델하면 왠지 어렵게 느껴지시나요? 걱정 마세요! 제가 오늘 lm() 함수 사용법부터 차근차근 설명해 드릴게요. 선형 회귀 모델의 기본 원리를 이해하고 나면, 모델 평가 및 해석하는 것도 훨씬 쉬워질 거예요. 실제 데이터 적용 … Read more

R에서 데이터 분할 (train_test_split() 대신 sample())

안녕하세요, 여러분! 데이터 분석을 하다 보면 항상 마주치는 중요한 단계, 바로 데이터 분할에 대해 이야기해보려고 해요. R에서 머신러닝 모델을 만들 때 흔히 `train_test_split()` 함수를 많이 사용하시죠? 저도 그랬어요! 하지만 오늘은 좀 더 자유롭게 데이터를 다룰 수 있는 `sample()` 함수를 소개해 드리려고 합니다. `sample()` 함수를 이용하면 `train_test_split()`보다 더욱 유연하게 데이터 샘플링을 할 수 있어요. 데이터 샘플링의 … Read more

R에서 머신러닝 패키지 (caret, randomForest, e1071)

안녕하세요! 😊 요즘 데이터 분석, 머신러닝 핫하잖아요. 그래서 오늘은 R 언어로 머신러닝을 시작하는 분들에게 정말 유용한 caret, randomForest, e1071 패키지에 대해 같이 알아보려고 해요! 머신러닝, 어렵게 느껴지셨다면 이제 걱정 뚝! 🤗 복잡한 알고리즘들을 간편하게 사용할 수 있도록 도와주는 패키지들이거든요. 특히 caret 패키지는 여러 머신러닝 알고리즘을 한 번에 비교하고, 최적의 모델을 찾아주는 마법같은 기능을 제공한답니다. randomForest는 … Read more