전체 글 186

119. [Python] [Pandas] 프로그래밍 실습 : (피어슨 상관 계수)CCTV

피어슨 상관 계수와 AI의 관계 피어슨 상관 계수(Pearson Correlation Coefficient)는 두 변수 간의 선형 관계를 측정하는 지표로, AI와 데이터 분석에서 다양한 방식으로 활용됩니다. AI에서 피어슨 상관 계수는 데이터의 패턴을 이해하고 예측 모델의 성능을 높이는 데 중요한 역할을 합니다. 데이터 탐색:변수 간 관계를 이해하는 데 사용됩니다.예: 고객 나이와 구매 금액의 상관관계 분석으로 관련성 파악특성 선택:중요한 변수를 선별하고 불필요한 변수를 제거합니다.목표 변수와의 상관계수를 기준으로 특성의 중요도를 평가합니다.모델의 복잡성을 줄이고 성능을 개선합니다.다중공선성 해결:독립 변수 간 강한 상관관계를 식별합니다.필요시 상관성이 높은 변수를 제거하거나 차원 축소 기법을 적용합니다..

AI/실습 2025.01.24

117. [Python] [Pandas] 프로그래밍 실습 : 대중교통

TIP💡주피터 노트북 한글타이핑 # 한글 찍기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sb%matplotlib inlineimport platformfrom matplotlib import font_manager, rcplt.rcParams['axes.unicode_minus'] = Falseif platform.system() == 'Darwin':    rc('font', family='AppleGothic')elif platform.system() == 'Windows':    path = "c:/Windows/Fonts/malgun.ttf"    font_name = font_mana..

AI/실습 2025.01.24

116. [Python] [Pandas] 프로그래밍 실습 : 기온데이터 분석

seoul.csv 파일을 읽어와 데이터를 확인합니다.파일 인코딩은 cp949로 설정합니다.df =  read_csv('../data/seoul.csv',encoding = 'cp949')import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sb%matplotlib inlineimport platform   문제 1. 가장 더운 날 찾기가장 더운날은 언제입니까?   풀이 1.import pandas as pddf['최고기온(℃)'].max()max_temp = df['최고기온(℃)'].max()df.loc[df['최고기온(℃)'] == max_temp] 출력최고기온은 38.4℃이며, 1994년 7월 24일에..

AI/실습 2025.01.24

115. [Python] [Pandas] 프로그래밍 기본 사항 : DataBivariate (여러개의 변수간의) Visualization 방법

DataBivariate (여러개의 변수간의) Visualization 방법         my_order = df['make'].value_counts().indexplt.figure(figsize = (10,20))sb.countplot(data = df, y = 'make', order = my_order)plt.show()       참고위와 같이 countplot로 자료를 생성하기에 광범위 할경우  지금 소개하는 방법들을 사용하면 유용합니다.     TIP💡    corr()  : 메서드는 pandas에서 DataFrame의 열 간 상관관계를 계산하는 데 사용됩니다.  dataframe.corr(method='pearson', min_periods=1)        1. Scatter Plot..

Python/이론 2025.01.23

114. [Python] [Pandas] 프로그래밍 기본 사항 : Tidy Data

Tidy Data란?데이터를 **관측값(row)**과 **특성값(column)**으로 정리하는 것.*각 행(row)**은 하나의 관측값에 해당하고, **각 열(column)**은 하나의 변수(특성)를 의미. 먼저 Pandas로 데이터를 불러오고 구조를 확인합니다.import pandas as pd# CSV 파일 불러오기df = pd.read_csv('../data/example.csv')# 데이터 구조 확인print(df.head())print(df.info()) Tidy Data로 변환하기 1. Pivot을 활용한 데이터 정리이 배열은 다양한 데이터 분석, 시각화, 수학적 연산 등에 활용될 수 있습니다.x = np.arange(0,9+1)y = xplt.plot( x, y )# 설명필요없고 표만 보여줘..

Python/이론 2025.01.23

112. [Python] [Pandas] 프로그래밍 기본 사항 : CONCATENATING AND MERGING

1. 데이터프레임의 생성 pd.DataFrame을 사용하여 데이터프레임을 생성합니다.각 데이터프레임의 인덱스와 컬럼을 지정하여 데이터를 생성합니다. df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}, index=[0, 1, 2, 3])df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B..

Python/이론 2025.01.23

111. [Python] [Pandas] 프로그래밍 기본 사항 : Pandas Series의 문자열 메서드 (str.)

Series의 문자열 메서드 (str.) Pandas는 문자열 데이터를 처리하기 위한 다양한 문자열 메서드를 제공합니다. 이 메서드들은 Series의 각 요소에 대해 문자열 연산을 수행하도록 설계되어 있어, 데이터 전처리와 분석 과정에서 매우 유용합니다. 1. 문자열 메서드의 주요 종류Pandas의 str 속성을 사용하면 Python 문자열 함수와 유사한 작업을 Series의 각 요소에 적용할 수 있습니다. 주요 메서드는 다음과 같습니다: 메서드 설명 str.upper문자열을 대문자로 변환str.lower문자열을 소문자로 변환str.strip문자열의 양쪽 공백 제거str.lstrip문자열의 왼쪽 공백 제거str.rstrip문자열의 오른쪽 공백 제거str.replace특정 문자열 또는 정규 ..

Python/이론 2025.01.23

110. [Python] [Pandas] 프로그래밍 기본 사항 : Dealing with NaN

Dealing with NaN 이론      1. NaN 값 탐지하기데이터프레임에 NaN 값을 확인하려면 다음 메서드를 사용할 수 있습니다:isna() 또는 isnull(): 데이터프레임에서 NaN 여부를 Boolean 값으로 반환합니다.notna() 또는 notnull(): NaN이 아닌 값을 Boolean 값으로 반환합니다. 예제:# DataFrame 생성items2 = [ {'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes': 8, 'suits': 45}, {'bikes': 15, 'glasses': 50, 'pants': 5, 'shirts': 2, 'shoes': 5, 'suits': 7}, {'bikes': 20, '..

Python/이론 2025.01.22

109. [Python] [Pandas] 프로그래밍 기본 사항 : Dataframe

Pandas DataFrames 1. DataFrame 생성Pandas에서 DataFrame은 2차원 데이터 구조로, 행과 열로 구성된 데이터를 다룹니다.import pandas as pd# 데이터 생성items2 = [ {'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants': 5}]# DataFrame 생성df = pd.DataFrame(data=items2, index=['store 1', 'store 2'])# 출력 확인print(df)  출력: bikes pants watches glasses  bikes pants watches glassesstore ..

Python/이론 2025.01.22
home top bottom
}