Python/이론 20

115. [Python] [Pandas] 프로그래밍 기본 사항 : DataBivariate (여러개의 변수간의) Visualization 방법

DataBivariate (여러개의 변수간의) Visualization 방법         my_order = df['make'].value_counts().indexplt.figure(figsize = (10,20))sb.countplot(data = df, y = 'make', order = my_order)plt.show()       참고위와 같이 countplot로 자료를 생성하기에 광범위 할경우  지금 소개하는 방법들을 사용하면 유용합니다.     TIP💡    corr()  : 메서드는 pandas에서 DataFrame의 열 간 상관관계를 계산하는 데 사용됩니다.  dataframe.corr(method='pearson', min_periods=1)        1. Scatter Plot..

Python/이론 2025.01.23

114. [Python] [Pandas] 프로그래밍 기본 사항 : Tidy Data

Tidy Data란?데이터를 **관측값(row)**과 **특성값(column)**으로 정리하는 것.*각 행(row)**은 하나의 관측값에 해당하고, **각 열(column)**은 하나의 변수(특성)를 의미. 먼저 Pandas로 데이터를 불러오고 구조를 확인합니다.import pandas as pd# CSV 파일 불러오기df = pd.read_csv('../data/example.csv')# 데이터 구조 확인print(df.head())print(df.info()) Tidy Data로 변환하기 1. Pivot을 활용한 데이터 정리이 배열은 다양한 데이터 분석, 시각화, 수학적 연산 등에 활용될 수 있습니다.x = np.arange(0,9+1)y = xplt.plot( x, y )# 설명필요없고 표만 보여줘..

Python/이론 2025.01.23

112. [Python] [Pandas] 프로그래밍 기본 사항 : CONCATENATING AND MERGING

1. 데이터프레임의 생성 pd.DataFrame을 사용하여 데이터프레임을 생성합니다.각 데이터프레임의 인덱스와 컬럼을 지정하여 데이터를 생성합니다. df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}, index=[0, 1, 2, 3])df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B..

Python/이론 2025.01.23

111. [Python] [Pandas] 프로그래밍 기본 사항 : Pandas Series의 문자열 메서드 (str.)

Series의 문자열 메서드 (str.) Pandas는 문자열 데이터를 처리하기 위한 다양한 문자열 메서드를 제공합니다. 이 메서드들은 Series의 각 요소에 대해 문자열 연산을 수행하도록 설계되어 있어, 데이터 전처리와 분석 과정에서 매우 유용합니다. 1. 문자열 메서드의 주요 종류Pandas의 str 속성을 사용하면 Python 문자열 함수와 유사한 작업을 Series의 각 요소에 적용할 수 있습니다. 주요 메서드는 다음과 같습니다: 메서드 설명 str.upper문자열을 대문자로 변환str.lower문자열을 소문자로 변환str.strip문자열의 양쪽 공백 제거str.lstrip문자열의 왼쪽 공백 제거str.rstrip문자열의 오른쪽 공백 제거str.replace특정 문자열 또는 정규 ..

Python/이론 2025.01.23

110. [Python] [Pandas] 프로그래밍 기본 사항 : Dealing with NaN

Dealing with NaN 이론      1. NaN 값 탐지하기데이터프레임에 NaN 값을 확인하려면 다음 메서드를 사용할 수 있습니다:isna() 또는 isnull(): 데이터프레임에서 NaN 여부를 Boolean 값으로 반환합니다.notna() 또는 notnull(): NaN이 아닌 값을 Boolean 값으로 반환합니다. 예제:# DataFrame 생성items2 = [ {'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes': 8, 'suits': 45}, {'bikes': 15, 'glasses': 50, 'pants': 5, 'shirts': 2, 'shoes': 5, 'suits': 7}, {'bikes': 20, '..

Python/이론 2025.01.22

109. [Python] [Pandas] 프로그래밍 기본 사항 : Dataframe

Pandas DataFrames 1. DataFrame 생성Pandas에서 DataFrame은 2차원 데이터 구조로, 행과 열로 구성된 데이터를 다룹니다.import pandas as pd# 데이터 생성items2 = [ {'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants': 5}]# DataFrame 생성df = pd.DataFrame(data=items2, index=['store 1', 'store 2'])# 출력 확인print(df)  출력: bikes pants watches glasses  bikes pants watches glassesstore ..

Python/이론 2025.01.22

108. [Python] [Pandas] 프로그래밍 기본 사항 : Series

PandasPandas는 데이터 분석과 조작에 강력한 도구입니다. 아래와 같은 기능을 제공합니다:행과 열에 라벨 사용 가능기본적인 통계 데이터 제공NaN 값을 자동으로 처리숫자와 문자열을 자동으로 로드데이터셋을 병합(Merge) 가능NumPy 및 Matplotlib과의 통합 지원 1. Pandas Series 데이터 생성Pandas의 Series는 1차원 데이터 구조입니다. 라벨과 데이터를 연결하여 데이터를 효과적으로 다룰 수 있습니다.  TIP💡 위와 같이 불러올 단어 한두단어를 누르고 'Tab' 키를 누르면 단축키를 불러올 수 있습니다.   pandas 를 불러오는 방법import pandas as pdimport pandas as pdindex = ['eggs', 'apples', 'milk', ..

Python/이론 2025.01.22

107. [Python] [Pandas] 프로그래밍 기본 사항 : Series Attributes

https://pandas.pydata.org/ pandas - Python Data Analysis Librarypandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now!pandas.pydata.org 주요 Series Attributes 1. index설명: Series의 축(axis) 레이블로, 각 데이터의 위치를 나타냅니다.특징:기본값은 정수형(RangeIndex)이지만 문자열이나 날짜 등으로 변경 가능.데이터의 행을 식별하거나 참조하는 데 ..

Python/이론 2025.01.21

106. [Python] 프로그래밍 기본 사항 : NUMPY BASICS

Numpy란 무엇인가?Numpy는 다차원 배열을 처리할 수 있는 선형대수학(Linear Algebra) 라이브러리입니다.데이터 분석 및 과학 연산에서 매우 중요한 역할을 합니다.Numpy를 설치하려면:를 실행하세요.conda install numpy   저의 경우 기존 jupyter notebook 설치시 pandas와 같이 설치완료 하였습니다. 😁  1. Numpy 배열의 구조 이해하기Numpy 배열은 1D, 2D, 3D와 같은 다양한 차원을 지원합니다.아래 이미지는 1D 배열, 2D 배열, 3D 배열의 구조와 shape를 보여줍니다.   2. Python에서 Numpy 배열 생성Numpy 배열을 생성하는 가장 기본적인 방법:리스트와 배열의 차이를 이해하세요. Numpy 배열은 다양한 연산과 벡터화를..

Python/이론 2025.01.21

104. [Python] 프로그래밍 기본 사항 : Random & Datetime

1. Random 모듈: 난수 생성 및 활용1-1.  0.0 ~ 1.0 사이 난수 생성import randomrandom.random() 출력: 0.5702222105345648 0.0 ~ 1.0 사이의 난수를 반환합니다.예: 암호 초기화 등에 활용 가능. 1-1-1.  특정 범위에서 난수 생성 random.random() * 10 출력:  3.143937127274532 0 ~ 10 사이의 난수 생성.   1-2.  정수형 난수 생성random.randint(1, 45) 출력:  21randint(a, b)는 a와 b 사이의 정수를 반환.  1-3.  실수형 난수 생성random.uniform(1, 5) 출력:  1.956151577492291 uniform(a, b)는 a와 b 사이의 실수를 반환. ..

Python/이론 2025.01.21
home top bottom
}