Artificial Intelligence/Pandas Basics
[Pandas Basics] 시리즈가 뭐야?
FiveReptile
2021. 2. 10. 18:40
728x90
시리즈(Series)는 index와 value로 이뤄진 데이터 타입으로 1차원 배열의 형태를 가지고 있다.
판다스의 Series 데이터 타입에 대해서 알아볼 것은 다음과 같다.
- 딕셔너리를 사용한 생성(리스트 -> 시리즈)
- 리스트를 사용한 생성(딕셔너리 -> 시리즈)
- 시리즈 index 설정 1, 2
- 시리즈 원소 선택 1 - index 지정 선택
- 시리즈 원소 선택 2 - index 범위 선택
다음은 주피터 노트북의 실습 코드와 결과 화면이다. 실습 코드에 대한 실행 화면은 같은 블록 밑에서 확인하면 된다.
# 리스트 -> 시리즈
data1 = ['파이썬', 'a+', 98, '데이터 사이언스']
sr1 = pd.Series(data1)
sr1
0 파이썬
1 a+
2 98
3 데이터 사이언스
dtype: object
위의 코드는 리스트를 사용하여 시리즈를 만드는 방법이다.
# 딕셔너리 -> 시리즈
data2 = {'a': 1, 'b': 2, 'c': 3}
sr2 = pd.Series(data2)
sr2
a 1
b 2
c 3
dtype: int64
위의 코드는 딕셔너리를 사용하여 시리즈를 만드는 방법이다.
# 시리즈 index 설정 1
sr1.index = ['프로그래밍', '성적', '점수', '과목']
sr1
프로그래밍 파이썬
성적 a+
점수 98
과목 데이터 사이언스
dtype: object
만들어진 시리즈 데이터의 index를 설정해주는 방법이다.
# 시리즈 index 설정 2
sr2 = pd.Series(data2, index=list('abc'))
sr2
a 1
b 2
c 3
dtype: int64
시리즈 데이터를 만들 때 index를 설정해주는 방법이다.
# 시리즈 원소 선택 1 - index 지정 선택
sr2[0], sr2['b']
(1, 2)
시리즈 원소는 배열 처럼 index를 사용하여 출력할 수도 있고, 설정되어 있는 index 이름을 사용하여 출력할 수도 있다.
# 시리즈 원소 선택 2 - index 범위 선택
sr2[[1,2]], sr2[1:3]
(b 2
c 3
dtype: int64,
b 2
c 3
dtype: int64)
시리즈 원소는 sr2[[1,2]]처럼 이차원 배열로 넘겨주어서 선택할 수도 있고, sr2 [1:3]으로 만들어서 넘겨줄 수도 있다.
728x90