AI 29

124. [Python] [Machine Learning] : 선형 회귀 Linear Regression(연봉 예측)

1. 선형 회귀(Linear Regression)란?선형 회귀는 독립 변수(Feature)와 종속 변수(Target) 간의 선형 관계를 모델링하는 방법입니다.수식:y=wx+byyy: 종속 변수 (예측값, 연봉)xxx: 독립 변수 (입력 데이터, 경력)www: 기울기 (weight, 가중치)bbb: 절편 (bias)y=wx+by = wx + b목표: 데이터와 가장 잘 맞는 직선을 찾아 yyy 값을 정확히 예측하는 것.    2. 데이터 이해  2-1. 문제 정의회사 직원의 경력(Years of Experience) 데이터를 이용해 연봉(Salary)을 예측합니다. 2-2. Python을 활용한 데이터 로드# Importing the librariesimport numpy as npimport matplot..

AI/이론 2025.01.25

123. [Python] [Machine Learning] : 지도 학습 (Supervised Learning)

1. 지도 학습(Supervised Learning)이란?지도 학습은 머신 러닝의 한 종류로, **입력 데이터(Input)**와 이에 상응하는 **정답 데이터(Output)**를 사용하여 학습하는 알고리즘입니다. 모델은 주어진 데이터를 학습한 후, 새로운 데이터에 대한 예측을 수행합니다.입력 데이터(X): 모델이 학습할 특징(Features) 데이터정답 데이터(y): 각 입력 데이터에 대한 실제 정답(Label)# Data Preprocessing Template# Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd    2. 지도 학습의 주요 유형2-1. 회귀(Regression)목표: 연속..

AI/실습 2025.01.25

122. [Python] [Machine Learning] : 인공지능 vs 머신러닝 vs 딥러닝

1. 인공지능(AI)이란?정의: 사람처럼 생각하고 학습하며 문제를 해결할 수 있는 기술.목적: 사람의 지능을 흉내 내어 다양한 작업을 수행.일상 예시:스마트 스피커:"오늘 날씨 어때?" 질문에 적절히 대답.(질문 → 이해 → 응답)자동차 내비게이션:최적의 경로를 찾아 안내.(지도 데이터 → 판단 → 결과 제공)   2. 머신러닝(Machine Learning)이란?정의: AI의 한 분야로, 데이터를 학습하여 새로운 데이터를 예측하거나 결정을 내림.핵심 개념:데이터를 입력하면 컴퓨터가 패턴을 학습.학습 결과를 바탕으로 새로운 문제를 해결.일상 예시:넷플릭스 추천 시스템:당신이 본 영화 데이터를 학습 → 좋아할 영화를 추천.이메일 스팸 필터링:스팸 이메일의 특징을 학습 → 스팸과 일반 이메일 구분.   3...

AI 2025.01.25

121. [Python] [Pandas] 프로그래밍 실습 : 범죄현장

범죄 데이터 구별로 정리하기   문제 4. '구별' 피봇팅인덱스를 '구별'로 피봇팅 한다. df.drop('관서명',axis = 1, inplace = True)df = pd.pivot_table(df,index = ['구별'],aggfunc = 'sum')df.head()  출력:  df    문제 5. 컬림추가'강간검거율' , '강도검거율', '살인검거율', '절도검거율', '폭력검거율'을 계산하여, crime_anal에 각 칼럼을 추가한다. ( 검거율은 * 100까지 한 값)   풀이  5. df['강간검거율'] = df['강간 검거']/df['강간 발생']*100df['강도검거율'] = df['강도 검거']/df['강도 발생']*100df['살인검거율'] = df['살인 검거']/df['살인 발..

AI/실습 2025.01.25

119. [Python] [Pandas] 프로그래밍 실습 : (피어슨 상관 계수)CCTV

피어슨 상관 계수와 AI의 관계 피어슨 상관 계수(Pearson Correlation Coefficient)는 두 변수 간의 선형 관계를 측정하는 지표로, AI와 데이터 분석에서 다양한 방식으로 활용됩니다. AI에서 피어슨 상관 계수는 데이터의 패턴을 이해하고 예측 모델의 성능을 높이는 데 중요한 역할을 합니다. 데이터 탐색:변수 간 관계를 이해하는 데 사용됩니다.예: 고객 나이와 구매 금액의 상관관계 분석으로 관련성 파악특성 선택:중요한 변수를 선별하고 불필요한 변수를 제거합니다.목표 변수와의 상관계수를 기준으로 특성의 중요도를 평가합니다.모델의 복잡성을 줄이고 성능을 개선합니다.다중공선성 해결:독립 변수 간 강한 상관관계를 식별합니다.필요시 상관성이 높은 변수를 제거하거나 차원 축소 기법을 적용합니다..

AI/실습 2025.01.24

117. [Python] [Pandas] 프로그래밍 실습 : 대중교통

TIP💡주피터 노트북 한글타이핑 # 한글 찍기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sb%matplotlib inlineimport platformfrom matplotlib import font_manager, rcplt.rcParams['axes.unicode_minus'] = Falseif platform.system() == 'Darwin':    rc('font', family='AppleGothic')elif platform.system() == 'Windows':    path = "c:/Windows/Fonts/malgun.ttf"    font_name = font_mana..

AI/실습 2025.01.24

116. [Python] [Pandas] 프로그래밍 실습 : 기온데이터 분석

seoul.csv 파일을 읽어와 데이터를 확인합니다.파일 인코딩은 cp949로 설정합니다.df =  read_csv('../data/seoul.csv',encoding = 'cp949')import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sb%matplotlib inlineimport platform   문제 1. 가장 더운 날 찾기가장 더운날은 언제입니까?   풀이 1.import pandas as pddf['최고기온(℃)'].max()max_temp = df['최고기온(℃)'].max()df.loc[df['최고기온(℃)'] == max_temp] 출력최고기온은 38.4℃이며, 1994년 7월 24일에..

AI/실습 2025.01.24
home top bottom
}