Python/pandas

데이터 분석 및 시각화 Pandas 데이터 분석 라이브러리 07. 데이터 선택 (loc)

마게더 2022. 5. 13. 02:21
반응형

7. 데이터 선택(loc)
이름을 이용하여 원하는 row에서 원하는 col 선택


import pandas as pd
df = pd.read_excel('score.xlsx', index_col='지원번호')

df
이름	학교	키	국어	영어	수학	과학	사회	SW특기
지원번호									
1번	채치수	북산고	197	90	85	100	95	85	Python
2번	정대만	북산고	184	40	35	50	55	25	Java
3번	송태섭	북산고	168	80	75	70	80	75	Javascript
4번	서태웅	북산고	187	40	60	70	75	80	NaN
5번	강백호	북산고	188	15	20	10	35	10	NaN
6번	변덕규	능남고	202	80	100	95	85	80	C
7번	황태산	능남고	188	55	65	45	40	35	PYTHON
8번	윤대협	능남고	190	100	85	90	95	95	C#

df.loc['1번'] #index 1번 해당하는 전체 데이터를 가져옴
이름         채치수
학교         북산고
키          197
국어          90
영어          85
수학         100
과학          95
사회          85
SW특기    Python
Name: 1번, dtype: object
# index 1번에 해당하는 국어 데이터

df.loc['1번', '국어'] # index 1번에 해당하는 국어 데이터
90
# index 1,2번에 해당하는 영어 데이터

df.loc[['1번','2번'],['영어']] # index 1,2번에 해당하는 영어 데이터
영어
지원번호	
1번	85
2번	35

df.loc[['1번','2번'],['영어', '수학']] # index 1, 2번에 해당하는 영어, 수학 데이터
영어	수학
지원번호		
1번	85	100
2번	35	50

df.loc['1번':'5번', '국어':'사회'] #index 1 ~ 5번까지, 국어부터 사회까지 데이터, *1 ~ 5번까지 5개의 데이터를 가져옴
국어	영어	수학	과학	사회
지원번호					
1번	90	85	100	95	85
2번	40	35	50	55	25
3번	80	75	70	80	75
4번	40	60	70	75	80
5번	15	20	10	35	10

 

* loc 특정 column 데이터만 가져오기

 

loc[row_value, column_value]

 

특정 index 데이터만 가져올 경우

ex) df.loc['1번'] == df.loc['1번',:]

뒤에 column_value를 생략할 수 있음

 

특정 column 데이터만 가져올 경우

ex) df.loc['학교'] 오류, 반드시 df.loc[:,'학교'] 

 

 

반응형