일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- K 데이터 자격시험
- Seaborn
- 빅데이터 분석기사
- separating data(데이터 분리하기)
- 응시료
- List Comprehension
- matplotlib
- pythonML
- numpy
- 검정수수료
- 준비
- context manger1
- teen learn
- 시험 일정
Archives
- Today
- Total
재원's 블로그
separating data(데이터 분리하기) 본문
최초 작성일 : 2021-11-15
categories: Pandas
오늘은 '데이터 분리하기'를 해보았다.
import pandas as pd df = pd.DataFrame([{"country":"한국","population":500},{"country":"미국","population":450},{"country":"싱가폴","population":705}, {"country":"호주","population":878},{"country":"베트남","population":660},{"country":"대만","population":808}])
위 코드는 'DataFrame'에 값을 넣어서
'DataFrame'을 객체로 다룰 수 있게 미리 만들어주는 코드이다.
이렇게 'DataFrame'을 출력해서 값이 잘 드러갔는지 확인한다.
print(df)
이렇게 준비가 끝나면
이제 코딩만 하면된다.
df[df['country'] == '한국'] #여기서 만일 country가 한국일 때를 선택하고 싶다면 아래와 같이 코드를 작성하면 된다.
#country가 한국이거나 호주일때의 데이터를 추출하고 싶다면 아래와 같이 코드를 작성하면 된다. df[(df['country']=='한국') | (df['country']=='호주')]
#country가 한국이 아닌 것 중 population이 800이상인 것을 추출하는 것이다. df[(df['country']!='한국') & (df['population']>=800)]
조건을 둘다 만족해야 할때
df[(조건1) & (조건2)]
조건 중 하나라도 만족하면 될때
df[(조건1) | (조건2)]
#country가 한국이 아닌 것 중 population이 800이상인 것을 추출하는 것이다. df[(df['country']!='한국') & (df['population']>=800)]
#만일 리스트 조건 안에 포함되는 데이터를 추출하고 싶다면 isin()함수를 사용해주면 된다. #만일, country가 [한국, 일본, 대만, 영국, 호주] 리스트에 포함되는 것을 추출하고 싶다면 기존에 #조건을 여러개 열거했던 것처럼 사용하지 않고 아래 코드와 같은 형태를 사용함으로써 데이터를 추출할 수 있다. country_list = ['한국', '일본', '대만', '영국', '호주'] df[df['country'].isin(country_list)]
#반대로 country 열에 country_list에 포함되지 않는 데이터를 추출하고 싶다면 아래 코드 처럼 위의 코드에서 ~를 붙여 사용하면 된다. country_list = ['한국', '일본', '대만', '영국', '호주'] df[~df['country'].isin(country_list)]
#위처럼 리스트 조건에 포함되는 혹은 포함되지 않는 데이터를 추출할 때, #in 혹은 not in 키워드를 사용해도 될 수 있겠다고 하지만, 불가능하다. #만일 in 키워드를 사용해 아래 코드와 같이 작성하면 아래 첨부한 사진 같은 오류가 발생할 것이다. # 잘못된 방식 country_list = ['한국', '일본', '대만', '영국', '호주'] df[df['country'] in country_list]
'Pandas' 카테고리의 다른 글
bar graph2(막대그래프) (0) | 2023.01.21 |
---|---|
pandas 기본문법과 함수 (0) | 2023.01.21 |