분류 전체보기
-
서포트 벡터 머신 (SVM, Support Vector Machine): 개념부터 실습까지🐍 Python 2025. 1. 31. 11:21
1️⃣ SVM이란?서포트 벡터 머신(SVM, Support Vector Machine)은 지도 학습(Supervised Learning) 기반의 강력한 분류(Classification) 알고리즘입니다. SVM은 결정 초평면(Hyperplane)을 학습하여 데이터를 두 개 이상의 클래스로 나누는 방식으로 작동합니다.📌 SVM의 핵심 개념마진(Margin) 최대화: SVM은 데이터를 가장 잘 분리하는 결정 초평면을 찾고, 마진을 최대화합니다.서포트 벡터(Support Vectors): 결정 초평면과 가장 가까운 데이터 포인트들.커널 트릭(Kernel Trick): 데이터를 고차원으로 변환하여 선형적으로 구분할 수 있도록 함.📌 SVM의 활용 사례얼굴 인식 (Face Recognition)스팸 필터링 (S..
-
KK-최근접 이웃 (KNN, K-Nearest Neighbors) 알고리즘: 개념부터 실습까지🐍 Python 2025. 1. 31. 11:16
1️⃣ K-최근접 이웃(KNN)이란?📌 KNN의 핵심 개념비모수적(Non-parametric) 모델: 사전에 학습을 하지 않고, 데이터가 들어올 때마다 계산하여 예측.거리 기반 분류: 새로운 데이터가 들어왔을 때, 가장 가까운 K개의 데이터 포인트를 찾아 다수결 투표로 분류 결정.K 값의 설정: K 값이 크면 과적합(overfitting)을 방지하지만, 너무 크면 정확도가 떨어질 수 있음.📌 KNN의 활용 사례질병 예측 (환자의 증상이 기존 환자와 얼마나 유사한가?)추천 시스템 (비슷한 취향의 사용자가 좋아하는 콘텐츠 추천)이미지 분류 (손글씨 숫자 인식 등)2️⃣ KNN의 동작 원리데이터 포인트 간의 거리 계산가장 일반적으로 사용되는 거리는 유클리드 거리(Euclidean Distance)유클리드 ..
-
리니어리그레션 (Linear Regression) 완벽 이해: 경력과 연봉의 관계 예측하기- Prediction (예측)🐍 Python 2025. 1. 30. 19:28
2025.01.30 - [🐍 Python] - 머신러닝과 데이터 전처리 - 초보자를 위한 친절한 가이드 머신러닝과 데이터 전처리 - 초보자를 위한 친절한 가이드1. 머신러닝이란?머신러닝(Machine Learning)은 데이터를 이용하여 패턴을 학습하고, 이를 통해 예측을 수행하는 인공지능 기술입니다. 우리가 실생활에서 머신러닝을 만나는 사례는 다음과 같습니boohoday.com 1. 리니어 리그레션이란?우리는 종종 데이터를 통해 미래를 예측하고자 합니다. 예를 들어, 경력이 많을수록 연봉이 높아질까? 이런 질문을 데이터로 분석할 수 있습니다. 이를 위해 리니어 리그레션 (Linear Regression) 이라는 기법을 사용합니다.리니어 리그레션은 데이터를 분석하여 가장 잘 맞는 직선을 찾고, 이를 이..
-
머신러닝과 데이터 전처리 - 초보자를 위한 친절한 가이드🐍 Python 2025. 1. 30. 18:50
1. 머신러닝이란?머신러닝(Machine Learning)은 데이터를 이용하여 패턴을 학습하고, 이를 통해 예측을 수행하는 인공지능 기술입니다. 우리가 실생활에서 머신러닝을 만나는 사례는 다음과 같습니다.손으로 쓴 우편번호 자동 인식 (우체국 자동 시스템)의료 영상에서 종양 여부 판단 (AI 진단)신용카드 부정 사용 감지 (이상 거래 탐지)블로그 글의 주제 자동 분류 (텍스트 분류)고객을 취향이 비슷한 그룹으로 묶기 (추천 시스템)이처럼 머신러닝은 다양한 분야에서 활용되고 있으며, 우리가 해결하고자 하는 문제를 정의하고 적절한 데이터를 확보하는 것이 가장 중요합니다.2. 문제와 데이터 이해하기머신러닝을 적용하기 전에 다음과 같은 질문을 던져야 합니다.가지고 있는 데이터가 문제를 해결하는 데 충분한 정보를..
-
파이썬 그래프 관련 함수 정리 (Matplotlib 중심)🐍 Python 2025. 1. 29. 18:03
파이썬에서 그래프를 그릴 때 많이 사용하는 Matplotlib의 주요 함수들을 정리하였습니다. 특히, 선 스타일, 색상, 굵기, 마커 등을 조절하는 방법을 보기 쉽게 정리했습니다. 📊✨1️⃣ 그래프의 선(Line) 관련 옵션옵션설명예제color선 색상 지정plt.plot(x, y, color='red')linewidth / lw선 굵기 지정plt.plot(x, y, linewidth=2)linestyle / ls선 스타일 변경plt.plot(x, y, linestyle='--')alpha투명도 설정 (0~1)plt.plot(x, y, alpha=0.5)label범례(Label) 추가plt.plot(x, y, label="그래프")📌 선 스타일 종류'-' : 실선 (기본값)'--' : 점선'-.' : ..
-
로지스틱 회귀 (Logistic Regression): 머신러닝 이진 분류 알고리즘의 이해와 실습🐍 Python 2025. 1. 27. 16:11
1️⃣ 로지스틱 회귀란?로지스틱 회귀(Logistic Regression)는 머신러닝에서 이진 분류(Binary Classification) 문제를 해결하는 지도 학습(Supervised Learning) 알고리즘입니다.📌 로지스틱 회귀의 핵심 개념분류(Classification) 모델: 데이터를 두 개의 클래스로 나누는 모델.확률 예측: 특정 사건(예: 광고 클릭 여부)이 발생할 확률을 0과 1 사이의 값으로 예측.시그모이드 함수(Sigmoid Function) 사용: 로지스틱 회귀는 선형 회귀와 다르게 예측값을 0~1 사이의 확률값으로 변환.📌 로지스틱 회귀의 활용 사례이메일이 스팸인지 아닌지 분류암 진단(양성 또는 음성)은행 대출 승인 여부 예측광고 클릭 예측2️⃣ 로지스틱 회귀의 원리로지스틱 ..
-
파이썬 플롯(Python Plot) 완벽 가이드🐍 Python 2025. 1. 24. 12:31
데이터 분석에서 중요한 것은 단순한 숫자보다 시각화(Visualization)입니다. 파이썬에서는 다양한 라이브러리를 사용하여 데이터를 시각적으로 표현할 수 있으며, 대표적인 도구로는 Matplotlib, Seaborn, Plotly 등이 있습니다이 글에서는 파이썬에서 플롯을 생성하는 방법을 알아보고, 여러 가지 그래프 유형과 활용 방법을 예제와 함께 설명하겠습니다. 1️⃣ 파이썬에서 플롯(Plot)이란?플롯(Plot)은 데이터를 그래프로 표현하는 것을 의미합니다. 이를 통해 숫자 데이터의 패턴을 쉽게 이해하고, 데이터 간의 관계를 파악할 수 있습니다. 📌 파이썬에서 플롯을 그리는 주요 라이브러리:Matplotlib: 기본적인 그래프 라이브러리Seaborn: Matplotlib 기반의 고급 시각화 라이..
-
파이썬 기초 : 데이터 결합(조인)하는 방법🐍 Python 2025. 1. 23. 12:14
데이터 분석을 하다 보면 서로 다른 데이터셋을 합쳐야 하는 경우가 많습니다. 이때 SQL의 JOIN과 유사한 개념을 파이썬에서도 사용할 수 있습니다. 이번 글에서는 파이썬에서 데이터 결합(조인)하는 방법을 초보자도 쉽게 이해할 수 있도록 설명하고, SQL 조인과의 차이점도 비교해보겠습니다.1. 파이썬에서 데이터 조인이란? 파이썬에서 데이터 조인은 두 개 이상의 데이터프레임을 특정 기준(키, key)에 따라 합치는 과정을 의미합니다. 주로 pandas 라이브러리를 사용하여 데이터프레임을 병합(merge)하거나 결합(concatenate)할 수 있습니다.SQL에서의 JOIN과 매우 유사하지만, 문법과 방식에서 차이가 있습니다.2. SQL JOIN과 파이썬 pandas JOIN의 비교 비교 항목 SQL JO..