반응형
1. Series
1차원 데이터(정수, 실수 문자열 등)
Series 객체 생성
temp = pd.Series([-20,-10,10,20]
temp
###### 결과값 ####
0 -20
1 -10
2 10
3 20
dtype: int64
*********************************************
temp[0]
###### 결과값 ####
-20
temp = pd.Series([-20,-10,10,20], index=['jan','feb','mar','apr'])
temp
########### 결과값 #############
jan -20
feb -10
mar 10
apr 20
dtype: int64
*******************************************
temp['jan']
########## 결과값 ##############
-20
2. DataFrame
2차원 데이터(Series 모음)
data = {
'이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
'학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'],
'키' : [197, 184, 168, 187, 188, 202, 188, 190],
'국어' : [90, 40, 80, 40, 15, 80, 55, 100],
'영어' : [85, 35, 75, 60, 20, 100, 65, 85],
'수학' : [100, 50, 70, 70, 10, 95, 45, 90],
'과학' : [95, 55, 80, 75, 35, 85, 40, 95],
'사회' : [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
data
'''<결과값>
{'SW특기': ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#'],
'과학': [95, 55, 80, 75, 35, 85, 40, 95],
'국어': [90, 40, 80, 40, 15, 80, 55, 100],
'사회': [85, 25, 75, 80, 10, 80, 35, 95],
'수학': [100, 50, 70, 70, 10, 95, 45, 90],
'영어': [85, 35, 75, 60, 20, 100, 65, 85],
'이름': ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
'키': [197, 184, 168, 187, 188, 202, 188, 190],
'학교': ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고']}'''
----------------------------------------------------------------------------------------------
data['이름']
'''<결과값>
['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협']'''
import pandas as pd
df = pd.DataFrame(data)
df
df['이름']
df[['이름','키']]
Index 사용 가능.
df = pd.DataFrame(data,index=['1번','2번','3번','4번','5번','6번','7번','8번'])
df
원하는 Columns(열)만 출력 가능.
df = pd.DataFrame(data, columns=['이름','키','학교'])
df
3. Index
데이터에 접근할 수 있는 주소 값
df = pd.DataFrame(data,index=['1번','2번','3번','4번','5번','6번','7번','8번'])
df.index
''' 결과값
Index(['1번', '2번', '3번', '4번', '5번', '6번', '7번', '8번'], dtype='object')
'''
# 사용 함수 사용법 목록.
inplace = True 옵션을 넣어야 실제 데이터에 반영!!
df.index.name = '지원번호'
df.reset_index() # index 초기화 -> 설정한 index가 column으로 들어감 (그림참조)
df.reset_index(drop=True) # 원래 쓰던 '지원번호' 인덱스 삭제
df.reset_index(drop=True, inplace=True) # 실제 데이터에 바로 반영
# 사용함수 목록 (2)
df.set_index('이름') # Column 을 index로 설정
df.set_index('이름',inplace=True)
df
df.sort_index() # 인덱스로 오름차순 정렬
df.sort_index(ascending=False) # 내림차순으로 정렬
참고 : https://www.youtube.com/watch?v=PjhlUzp_cU0
반응형