[BDA 데이터분석모델링반(ML1) - 7주차] K-means 실습
·
BDA/데이터 분석 모델링반(ML1)
ML1반 7주차(2025.05.18): K-means 실습전국 연합 빅데이터 학회이자 대학생 학회인 BDA학회의 데이터분석모델링반(ML1) 7주차 수업이 진행되었다. 7주차 수업에서는 6주차에 배웠던 K-means 알고리즘을 실습을 통해 심화학습했다. 이번 글에서는 Numpy 라이브러리를 활용하여 KNN 알고리즘과 K-means 알고리즘을 구현한 내용을 정리하고 BDA 뉴스레터에 대해서도 작성해 보고자 한다. K-Means 알고리즘이란?K-평균(K-Means) 알고리즘은 주어진 데이터를 K 개의 군집(cluster)으로 나누는 비지도 학습(Unsupervised Learning) 알고리즘이며 대표적인 군집화 기법이다. K-means 알고리즘의 원리는 우선 각 군집마다 중심점(centroid)을 설정한 ..
[BDA 데이터분석모델링반(ML1) - 6주차] K-means
·
BDA/데이터 분석 모델링반(ML1)
ML1반 5주차(2025.05.04): KNN 알고리즘 실습전국 연합 빅데이터 학회이자 대학생 학회인 BDA학회의 데이터분석모델링반(ML1) 6주차 수업이 진행되었다. 6주차 수업에서는 K-means 알고리즘의 개념에 대해 배웠다. 본격적인 실습은 7주차에 진행하기 때문에 이번 주차에는 개념에 대한 부분만 정리할 예정이다. 배운 내용 외에도 희망 직무와 직무를 위한 노력에 대해 적어보고자 한다. K-Means 알고리즘이란?K-평균(K-Means) 알고리즘은 주어진 데이터를 K 개의 군집(cluster)으로 나누는 비지도 학습(Unsupervised Learning) 알고리즘이다. 데이터 간의 유사도를 기반으로 비슷한 특성을 가진 데이터끼리 그룹화할 수 있도록 도와주는 대표적인 군집화 기법이다. K-me..
[BDA 데이터분석모델링반(ML1) - 5주차] KNN 알고리즘 실습
·
BDA/데이터 분석 모델링반(ML1)
ML1반 5주차(2025.05.04): KNN 알고리즘 실습전국 연합 빅데이터 학회이자 대학생 학회인 BDA학회의 데이터분석모델링반(ML1) 5주차 수업이 진행되었다. 5주차 수업에서는 4주차에서 배운 KNN 알고리즘을 복습하고 실습을 통해 더 자세하게 학습하였다. 한달이라는 긴 휴회 기간이 끝나고 첫 수업이라 수업을 듣는 게 조금 생소하기도 했다. 이전 주차와 마찬가지로 배운 내용을 정리하고 휴회기간 이후 새로운 마음가짐도 적어보고자 한다. KNN 알고리즘이란?K-최근접 이웃(K-Nearest Neighbors, KNN) 알고리즘은 새로운 데이터를 분류할 때, 이미 학습된 데이터 중 가장 가까운 K개의 이웃 데이터를 참조하여 분류하는 방식의 알고리즘이다. 가장 직관적이고 거리 개념만 알면 구현할 수 ..
[BDA 데이터분석모델링반(ML1) - 4주차] KNN 알고리즘
·
BDA/데이터 분석 모델링반(ML1)
ML1반 4주차(2025.03.30): KNN 알고리즘전국 연합 빅데이터 학회이자 대학생 학회인 BDA학회의 데이터분석모델링반(ML1) 4주차 수업이 진행되었다.4주차 수업에서는 KNN 알고리즘에 대해 배우고 실습을 진행했다.이번 주차는 수업을 듣지 못했기 때문에 혼자 공부한 내용을 정리하고 복습 과제의 일부를 업로드해 볼 생각이다. KNN 알고리즘이란?K-최근접 이웃(K-Nearest Neighbors, KNN) 알고리즘은 새로운 데이터를 분류할 때, 이미 학습된 데이터 중 가장 가까운 K개의 이웃 데이터를 참조하여 분류하는 방식의 알고리즘이다. 가장 직관적이고 거리 개념만 알면 구현할 수 있는 가장 간단한 지도 학습(Supervised Learning) 알고리즘 중 하나이다. 사용자 기반 추천 시스..
[BDA 데이터분석모델링반(ML1) - 3주차] 교차검증(2)/성능평가지표
·
BDA/데이터 분석 모델링반(ML1)
ML1반 3주차(2025.03.23): 교차검증(2)/성능평가지표전국 연합 빅데이터 학회이자 대학생 학회인 BDA학회의 데이터분석모델링반(ML1) 3주차 수업이 진행되었다.3주차 수업에서는 회귀와 분류에 따른 사이킷런 메소드와 머신러닝 모델 성능 평가 지표에 대해 배우고 실습을 진행했다.이번 포스트에서도 배운 내용을 정리하고 복습 과제의 일부를 업로드해 볼 생각이다. 교차검증(2)2주차에서 배운 교차 검증 과정을 사이킷런(sklearn)에서는 cross_val_score 와 cross_validate 메소드로 제공한다. 모듈을 불러와 매개변수 값을 바르게 입력하면 훨씬 간편한 코드로 교차 검증을 진행할 수 있다. 여러 모델을 배열로 저장하여 매개변수 값으로 전달하면 여러 모델을 사용하여 교차 검증이 가..
[BDA 데이터분석모델링반(ML1) - 2주차] 교차검증(1)
·
BDA/데이터 분석 모델링반(ML1)
ML1반 2주차(2025.03.16): 교차검증(1)전국 연합 빅데이터 학회이자 대학생 학회인 BDA학회의 데이터분석모델링반(ML1) 2주차 수업이 진행되었다.2주차 수업에서는 교차 검증의 필요성과 여러 가지 교차 검증 방식에 대해 간단히 배우고 K-Fold와 Stratified K-Fold 실습을 진행했다.이번 포스트에서는 배운 내용을 정리하고 복습 과제의 일부를 업로드해 볼 생각이다. 교차검증(Cross-Validation, CV)이란?교차 검증은 모델의 일반화 성능을 평가하는 방법 중 하나로, 모델 성능 평가에 사용하는 테스트 데이터셋 외에 학습 데이터셋을 학습(train)과 검증(validation) 세트로 한 번 더 나누어 학습 및 평가를 반복하는 기법이다. 이를 통해 모델이 특정 데이터에 과..
[BDA 데이터분석모델링반(ML1) - 1주차] BDA란?
·
BDA/데이터 분석 모델링반(ML1)
BDA(Big Data Analysis)란?BDA학회는 (사)한국빅데이터학회 산하 기관으로, 전국 연합 빅데이터 학회 및 실무 연계 학회이다.대학생 학회라고 하는데, 현직자와 함께 소규모 스터디로 시작해서 빠르게 성장한 학회답게 관련 현직자 특강, 커피챗 등 다양한 활동이 있어 대학생 뿐만 아니라 취준생에게도 매우 유용하다고 생각한다.​나의 경우에도 취업 준비를 시작하면서 데이터 관련 공부를 하고 싶어 동아리와 학회를 찾아보던 중 BDA를 알게 되었고, 체계적인 커리큘럼과 다양한 활동에 매력을 느껴 바로 학회원이 되었다.학회원이 되는 과정이 간단하고 회비도 내 기준 비싸지 않아서 낡고 지친(..) 나에겐 딱 맞는 곳이었다.​∙https://bdaprogram.oopy.io/class BDA ClassB..