데이터분석3 [QGIS] 서울시 공공와이파이 분포 시각화 안녕하세요! '데박' 입니다. 오늘의 주제는 최적입지분석에서 자주쓰이는 "폴리곤 내부의 포인트 개수 계산 및 순위산정 코드" 입니다. □ 데이터 출처 1. 서울시 공공와이파이 서비스 위치 정보(CSV) : https://data.seoul.go.kr/dataList/OA-20883/S/1/datasetView.do - 건수 : 13648건 - 좌표계 : 4326 2. 서울시 500m 헥사곤 그리드(shapefile) - 지역 : 서울 전체 - 좌표계 : 5179 자!~ 시작합니다! □ 데이터 불러오기 보시는 바와 같이 [서울시 공공와이파이 서비스 위치] 데이터는 약 13000건이라서 어디에 공공와이파이가 많은지, 적은지 공간적 분포를 파악하기 힘들죠, 이럴때 추천드리는 방법이 그리드를 생성하여 공.. 2023. 3. 1. [Python/ML] K-NN (K-Nearest Neighbors) 안녕하십니까, '데 박' 입니다. 비전공자들도 쉽게 시작할 수 있는 머신러닝 알고리즘인 K-Nearest Neighbors(K-NN)에 대해 공부해보도록 하겠습니다. □ K-NN이란 K-NN알고리즘은 분류와 회귀, 모두에서 쓰일 수 있는 간단한 머신러닝 알고리즘입니다. 왜냐하면 K-NN의 모델링 과정은 훈련데이터셋을 그냥 저장하는 것이 과정의 전부입니다. K-NN은 새로운 데이터 포인트에 대해 예측할 땐 알고리즘이 훈련 데이터셋에서 가장 가까운 데이터 포인트, 즉 "최근접 이웃" 을 찾습니다. SVM은 훈련 데이터를 기반으로 최대 마진을 찾고 결정 경계(Decision Boundary)를 만들어, 이 결정 경계를 통해 테스트 데이터를 분류합니다. 따라서 SVM과 비교하여 K-NN은 사전 모델링이 필요.. 2023. 1. 10. [Python/ML] SVM (Support Vector Machine) 안녕하세요, 데 박입니다. 오늘은 머신러닝을 배운다면 꼭 알아야할 머신러닝 모델, SVM (Support Vector Machine)에 대해서 공부해보도록 하겠습니다. □ SVM (Support Vector Machine) SVM은 매우강력한 선형, 비선형 분류, 회귀 이상치 탐색에도 사용할 수 있는 다목적 머신러닝 모델입니다. 머신러닝에서 인기있는 모델에 속하고 SVM은 특히 복잡한 분류 문제에 잘 들어맞으며 작거나 중간 크기의 데이터셋에 적합합니다. 또한 이 글에서는 선형, 비선형 분류를 다루었으니 이 점 참고해주시길 바라겠습니다. □ 라지마진분류 from sklearn.svm import SVC from sklearn import datasets iris = datasets.load_iris().. 2023. 1. 4. 이전 1 다음