반응형

1. Series 

1차원 데이터(정수, 실수 문자열 등)

 

Series 객체 생성

 

temp = pd.Series([-20,-10,10,20]
temp

###### 결과값 ####

0   -20
1   -10
2    10
3    20
dtype: int64

*********************************************

temp[0]

###### 결과값 ####

-20

temp = pd.Series([-20,-10,10,20], index=['jan','feb','mar','apr'])
temp

########### 결과값 #############
jan   -20
feb   -10
mar    10
apr    20
dtype: int64

*******************************************
temp['jan']

########## 결과값 ##############
-20

 

2.  DataFrame

2차원 데이터(Series 모음)

 

data = {
    '이름' : ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
    '학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'],
    '키' : [197, 184, 168, 187, 188, 202, 188, 190],
    '국어' : [90, 40, 80, 40, 15, 80, 55, 100],
    '영어' : [85, 35, 75, 60, 20, 100, 65, 85],
    '수학' : [100, 50, 70, 70, 10, 95, 45, 90],
    '과학' : [95, 55, 80, 75, 35, 85, 40, 95],
    '사회' : [85, 25, 75, 80, 10, 80, 35, 95],
    'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
data
'''<결과값>
{'SW특기': ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#'],
 '과학': [95, 55, 80, 75, 35, 85, 40, 95],
 '국어': [90, 40, 80, 40, 15, 80, 55, 100],
 '사회': [85, 25, 75, 80, 10, 80, 35, 95],
 '수학': [100, 50, 70, 70, 10, 95, 45, 90],
 '영어': [85, 35, 75, 60, 20, 100, 65, 85],
 '이름': ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
 '키': [197, 184, 168, 187, 188, 202, 188, 190],
 '학교': ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고']}'''
 ----------------------------------------------------------------------------------------------
 
 data['이름']
 '''<결과값>
 ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협']'''

 


 

import pandas as pd
df = pd.DataFrame(data)
df

 

df['이름']

df[['이름','키']]


Index 사용 가능.

df = pd.DataFrame(data,index=['1번','2번','3번','4번','5번','6번','7번','8번'])
df

원하는 Columns(열)만 출력 가능.

df = pd.DataFrame(data, columns=['이름','키','학교'])
df


3. Index 

데이터에 접근할 수 있는 주소 값

 

df = pd.DataFrame(data,index=['1번','2번','3번','4번','5번','6번','7번','8번'])
df.index

''' 결과값
Index(['1번', '2번', '3번', '4번', '5번', '6번', '7번', '8번'], dtype='object')
'''

# 사용 함수 사용법 목록.

inplace = True 옵션을 넣어야 실제 데이터에 반영!!

df.index.name = '지원번호'
df.reset_index() # index 초기화 -> 설정한 index가 column으로 들어감 (그림참조)
df.reset_index(drop=True) # 원래 쓰던 '지원번호' 인덱스 삭제
df.reset_index(drop=True, inplace=True) # 실제 데이터에 바로 반영

df.index.name = '지원번호' 결과값

 

df.reset_index()
df.reset_index(drop=True) --&gt; 보여주기만 함 -&gt; 적용하려면 inplace 사용 필요.

 

# 사용함수 목록 (2)

df.set_index('이름') # Column 을 index로 설정
df.set_index('이름',inplace=True)
df

df.set_index('이름')

df.sort_index() # 인덱스로 오름차순 정렬
df.sort_index(ascending=False) # 내림차순으로 정렬

df.sort_index

참고 : https://www.youtube.com/watch?v=PjhlUzp_cU0
반응형

+ Recent posts