파이썬4 [Python/ML] Agglomerative Hierarchical Clustering (계층적 군집화) 안녕하세요, 원주 기술코치 박성호입니다. 오늘은 K-MEANS에 이어 계층적 군집화, Agglomerative Hierarchical Clustering에 대해서 글을 쓰게 되었네요. 바로 들어가보도록 하죠! □ Agglomerative Hierarchical Clustering(계층적 군집화) 개념 계층적 군집화는 말 그대로 데이터 하나하나를 계층에 따라 순차적으로 클러스터링 하는 기법입니다. 이 알고리즘은 각 데이터가 모두 나눠져있는 상태에서, 작은 단위로부터 클러스터링을 시작하여 모든 데이터를 묶을 때까지 반복하여 군집화를 진행합니다. 다음과 같이 12개의 index가 부여된 데이터가 있다고 가정하고, # 군집할 데이터 생성 from sklearn.dataset import make_blobs X,.. 2023. 1. 28. [Python/NLP] 네이버 쇼핑 리뷰 감성분석 귀찮음 주의!! # 한글폰트 설정 ## colab 환경에서 한글 폰트 설정 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf import matplotlib.pyplot as plt plt.rc('font', family='NanumBarunGothic') plt.title('안녕') 참고 문서 딥러닝을 이용한 자연어 처리 e-book : https://wikidocs.net/94600 박성호의 심화기계학습 팀프젝 코랩 코드 : https://colab.research.google.com/drive/1951HcDnn8PfdC7ucUpFkz4BnmVLhD3ed?usp=sharing 핸즈온 머신러닝 2판 gi.. 2023. 1. 6. [Python/ML] Random Forest (랜덤 포레스트) 안녕하십니까 데 박 입니다!! 저번 Decision Tree 기술자료에 이어 Random Forest 기술자료를 업로드합니다^^ □ 앙상블 학습과 랜덤포레스트 의사결정나무가 "하나의 거대한 나무" 라고 한다면, 랜덤포레스트는 보다 "작은 나무로 이루어진 숲" 이라고 이해하면 됩니다! 무작위로 선택된 수천명의 사람에게 복잡한 질문을 하고 대답을 모은다고 가정합니다, 많은 경우 이렇게 모은 답이 전문가의 답보다 낫습니다. 이를 대중의 지혜라고 합니다. 이와 비슷하게 일련의 예측기 (분류, 회귀 모델)로부터 예측을 수집하면 가장 좋은 모델 하나보다 더 좋은 예측을 얻을 수 있을 것입니다 이를 '앙상블(ensemble)' 이라고 합니다! 앙상블 방법의 예를 들면 훈련 세트로부터 무작위로 각기 다른 서브셋을.. 2022. 12. 10. [Python/ML] Decision Tree (의사결정나무) 안녕하십니까 데 박 입니다!! SVM처럼 Decision Tree는 분류와 회귀 작업 그리고 다중출력 작업도 가능한 다재다능한 머신러닝 알고리즘입니다. 또한 작동 방식도 비전공자들이 이해하기 쉽게 학습할 수 있는 간편하고 빠른 알고리즘입니다. Decision Tree 는 최근에 자주 사용하는 강력한 머신러닝 '앙상블' 알고리즘 중 랜덤포레스트, LightGBM, XGboost의 기본 구성요소이기도 한데요!! 나중에 머신러닝 위주인 실무형 프로젝트를 위해서는 Decision Tree는 "필수"라고 확신합니다!! □ Decision Tree는 무엇인가 Decision Tree는 분류와 회귀 문제에 널리 사용하는 모델입니다. 기본적으로 결정 트리는 결정에 다다르기 위해 예/아니오 질문을 이어 .. 2022. 12. 10. 이전 1 다음