Python/이론

107. [Python] [Pandas] 프로그래밍 기본 사항 : Series Attributes

천재단미 2025. 1. 21. 21:53
728x90
반응형

 

 

 


https://pandas.pydata.org/

 

pandas - Python Data Analysis Library

pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now!

pandas.pydata.org

 

주요 Series Attributes

 

1. index

  • 설명: Series의 축(axis) 레이블로, 각 데이터의 위치를 나타냅니다.
  • 특징:
    • 기본값은 정수형(RangeIndex)이지만 문자열이나 날짜 등으로 변경 가능.
    • 데이터의 행을 식별하거나 참조하는 데 사용됩니다.

예제:

import pandas as pd
s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(s.index)

 

출력

:  Index(['a', 'b', 'c'], dtype='object')

 
 
 

2. values

  • 설명: Series의 데이터 값들을 NumPy 배열(ndarray)로 반환합니다.
  • 특징:
    • 배열 형태로 데이터를 다룰 때 유용합니다.

예제:

print(s.values)

 

출력

:  [10 20 30]

 

 
 

3. dtype

  • 설명: Series의 데이터 타입을 반환합니다.
  • 특징:
    • Series에 포함된 모든 값은 동일한 데이터 타입을 가져야 합니다.

예제:

print(s.dtype)

 
 

출력

:    int64

 
 
 
 

4. name

  • 설명: Series의 이름을 반환하거나 설정합니다.
  • 특징:
    • 데이터를 명확하게 식별하기 위해 사용.

예제:
 
 
 

5. size

  • 설명: Series에 포함된 데이터의 총 개수를 반환합니다.

예제:

print(s.size)  # 3

 
 

6. shape

  • 설명: Series의 크기(모양)를 튜플 형태로 반환합니다.
  • 특징:
    • Series는 1차원 데이터이므로 (n,) 형태로 반환됩니다.

예제:

print(s.shape)  # (3,)

 
 

7. is_unique

  • 설명: Series의 데이터 값들이 유일한지 여부를 반환합니다.

예제:

print(s.is_unique)  # True

 
 

8. is_monotonic

  • 설명: Series의 값이 단조 증가(오름차순)인지 여부를 반환합니다.

예제:

print(s.is_monotonic)  # True

 
 

9. empty

  • 설명: Series가 비어있는지 여부를 반환합니다.
  • 특징:
    • 데이터가 없으면 True, 하나 이상의 데이터가 있으면 False.

예제:

empty_series = pd.Series([])
print(empty_series.empty)  # True

 
 

10. nbytes

  • 설명: Series 데이터가 메모리에서 차지하는 바이트 크기를 반환합니다.
  • 특징:
    • 메모리 사용량을 확인할 때 유용합니다.

예제:

print(s.nbytes)  # 24

 
 

11. hasnans

  • 설명: Series에 결측치(NaN)가 있는지 여부를 반환합니다.
  • 특징:
    • 결측치가 있으면 True, 없으면 False.

예제:

s_with_nan = pd.Series([1, 2, None])
print(s_with_nan.hasnans)  # True

 
 

12. memory_usage

  • 설명: Series의 메모리 사용량을 반환합니다.
  • 특징:
    • index 메모리까지 포함된 크기를 계산.
    • deep=True로 설정하면 객체형 데이터를 더 자세히 계산.

예제:

print(s.memory_usage())  # 176

 
 
 
 

3. 요약

Pandas의 Series Attributes는 데이터를 탐색하고 분석하는 데 중요한 역할을 합니다. 이를 활용하면 데이터의 구조, 타입, 크기, 메모리 사용량, 유효성 검사 등을 효율적으로 수행할 수 있습니다.
 
 

728x90
반응형
home top bottom
}