Backend 184

127. [Python] [Multiple Linear Regression] : 병원 진료비 예측 (Regression)

문제: 병원 진료비 예측 (Regression)데이터 설명 시나리오병원의 진료 데이터를 분석하여 환자의 기본 정보를 기반으로 진료비(InsuranceClaim)를 예측하려고 합니다.환자의 나이, 성별, BMI, 지역, 흡연 여부, 병원 방문 횟수 등의 정보를 활용합니다.  데이터 피처Age: 환자 나이 (정수, 0~100, 일부 결측치 있음)Gender: 성별 (Male, Female)BMI: 체질량지수(Body Mass Index, 실수, 일부 결측치 있음)Region: 환자가 거주하는 지역 (North, South, East, West)Smoker: 흡연 여부 (Yes, No)NumVisits: 연간 병원 방문 횟수 (정수, 일부 결측치 있음)InsuranceClaim: 진료비 청구 금액(단위: 만원..

AI/실습 2025.01.28

126. [Python] [Multiple Linear Regression] : 이커머스(온라인 쇼핑몰) 상품 일간 판매량 예측

문제 이커머스(온라인 쇼핑몰) 상품 일간 판매량 예측시나리오이커머스에서는 마케팅 예산, 프로모션 여부, 계절, 경쟁사 가격 정책 등이 판매량에 영향을 줄 수 있습니다.한 온라인 쇼핑몰에서 특정 상품(예: 여름 티셔츠)의 일간 판매량을 예측하려고 합니다. 피처(입력변수) 예시DayOfWeek: 요일(0=월, 6=일)IsHoliday: 공휴일 여부 (0 또는 1)MarketingSpend: 당일 마케팅 지출액(만원 단위)CompetitorPrice: 경쟁사 판매가(원)Price: 우리 상품 판매가(원)Month: 달(1~12)타깃(출력변수)Sales: 판매량(당일 몇 개 팔렸는지) 데이터 다운로드 링크 LinearRegression 과 RandomForest 를 이용해서 더 성능이 좋은것으로 합니다.   다..

AI/실습 2025.01.27

125. [Python] [Machine Learning] : 다중 선형 회귀(Multiple Linear Regression)

다중 선형 회귀(Multiple Linear Regression) 1. 다중 선형 회귀(Multiple Linear Regression)란?예를 들어 주택 임대료를 예측한다고 했을 때, 주택의 면적만 고려해서 예측하면 단순회귀가 되겠지만 지어진지 얼마나 오래되었는지, 지하철역과 거리가 얼마나 가까운지 등 다양한 요소의 영향을 받는다. 결국 주택 임대료 y를 예측하려면 여러 개의 변수 x를 포함해야 하는 거다.다중 선형 회귀는 하나 이상의 독립 변수(입력 데이터)를 사용하여 종속 변수(출력 데이터)를 예측하는 회귀 알고리즘입니다.수학적 표현: Y=β0+β1X1+β2X2+⋯+βnXn+ϵYYY: 종속 변수X1,X2,…,XnX_1, X_2, \dots, X_nX1,X2,…,Xn: 독립 변수β0\beta_0β0:..

AI/이론 2025.01.27

124. [Python] [Machine Learning] : 선형 회귀 Linear Regression(연봉 예측)

1. 선형 회귀(Linear Regression)란?선형 회귀는 독립 변수(Feature)와 종속 변수(Target) 간의 선형 관계를 모델링하는 방법입니다.수식:y=wx+byyy: 종속 변수 (예측값, 연봉)xxx: 독립 변수 (입력 데이터, 경력)www: 기울기 (weight, 가중치)bbb: 절편 (bias)y=wx+by = wx + b목표: 데이터와 가장 잘 맞는 직선을 찾아 yyy 값을 정확히 예측하는 것.    2. 데이터 이해  2-1. 문제 정의회사 직원의 경력(Years of Experience) 데이터를 이용해 연봉(Salary)을 예측합니다. 2-2. Python을 활용한 데이터 로드# Importing the librariesimport numpy as npimport matplot..

AI/이론 2025.01.25

123. [Python] [Machine Learning] : 지도 학습 (Supervised Learning)

1. 지도 학습(Supervised Learning)이란?지도 학습은 머신 러닝의 한 종류로, **입력 데이터(Input)**와 이에 상응하는 **정답 데이터(Output)**를 사용하여 학습하는 알고리즘입니다. 모델은 주어진 데이터를 학습한 후, 새로운 데이터에 대한 예측을 수행합니다.입력 데이터(X): 모델이 학습할 특징(Features) 데이터정답 데이터(y): 각 입력 데이터에 대한 실제 정답(Label)# Data Preprocessing Template# Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd    2. 지도 학습의 주요 유형2-1. 회귀(Regression)목표: 연속..

AI/실습 2025.01.25

122. [Python] [Machine Learning] : 인공지능 vs 머신러닝 vs 딥러닝

1. 인공지능(AI)이란?정의: 사람처럼 생각하고 학습하며 문제를 해결할 수 있는 기술.목적: 사람의 지능을 흉내 내어 다양한 작업을 수행.일상 예시:스마트 스피커:"오늘 날씨 어때?" 질문에 적절히 대답.(질문 → 이해 → 응답)자동차 내비게이션:최적의 경로를 찾아 안내.(지도 데이터 → 판단 → 결과 제공)   2. 머신러닝(Machine Learning)이란?정의: AI의 한 분야로, 데이터를 학습하여 새로운 데이터를 예측하거나 결정을 내림.핵심 개념:데이터를 입력하면 컴퓨터가 패턴을 학습.학습 결과를 바탕으로 새로운 문제를 해결.일상 예시:넷플릭스 추천 시스템:당신이 본 영화 데이터를 학습 → 좋아할 영화를 추천.이메일 스팸 필터링:스팸 이메일의 특징을 학습 → 스팸과 일반 이메일 구분.   3...

AI 2025.01.25

121. [Python] [Pandas] 프로그래밍 실습 : 범죄현장

범죄 데이터 구별로 정리하기   문제 4. '구별' 피봇팅인덱스를 '구별'로 피봇팅 한다. df.drop('관서명',axis = 1, inplace = True)df = pd.pivot_table(df,index = ['구별'],aggfunc = 'sum')df.head()  출력:  df    문제 5. 컬림추가'강간검거율' , '강도검거율', '살인검거율', '절도검거율', '폭력검거율'을 계산하여, crime_anal에 각 칼럼을 추가한다. ( 검거율은 * 100까지 한 값)   풀이  5. df['강간검거율'] = df['강간 검거']/df['강간 발생']*100df['강도검거율'] = df['강도 검거']/df['강도 발생']*100df['살인검거율'] = df['살인 검거']/df['살인 발..

AI/실습 2025.01.25

119. [Python] [Pandas] 프로그래밍 실습 : (피어슨 상관 계수)CCTV

피어슨 상관 계수와 AI의 관계 피어슨 상관 계수(Pearson Correlation Coefficient)는 두 변수 간의 선형 관계를 측정하는 지표로, AI와 데이터 분석에서 다양한 방식으로 활용됩니다. AI에서 피어슨 상관 계수는 데이터의 패턴을 이해하고 예측 모델의 성능을 높이는 데 중요한 역할을 합니다. 데이터 탐색:변수 간 관계를 이해하는 데 사용됩니다.예: 고객 나이와 구매 금액의 상관관계 분석으로 관련성 파악특성 선택:중요한 변수를 선별하고 불필요한 변수를 제거합니다.목표 변수와의 상관계수를 기준으로 특성의 중요도를 평가합니다.모델의 복잡성을 줄이고 성능을 개선합니다.다중공선성 해결:독립 변수 간 강한 상관관계를 식별합니다.필요시 상관성이 높은 변수를 제거하거나 차원 축소 기법을 적용합니다..

AI/실습 2025.01.24
home top bottom
}