본문 바로가기

자격증공부/빅데이터분석기사

[빅데이터분석기사][작업형1] 4회 기출문제 풀이(기초통계, 날짜)

320x100

* 퇴근후딴짓 님의 강의를 참고하였습니다. *

 

[문제1] age 컬럼의 3사분위수와 1사분위수의 차를 절대값으로 구하고, 소수점 버려서, 정수로 출력

import pandas as pd
df = pd.read_csv("basic1.csv")

# print(df.head(3))
# print(df.info())

a = df['age'].quantile(.75)
b = df['age'].quantile(.25)

print(int(abs(a-b)))

* 사분위값 : df['컬럼명'].quantile(.25)

* 절대값 : abs(값)

* 정수형으로 출력 : int(값)

320x100

[문제2] (loves반응+wows반응)/(reactions반응) 비율이 0.4보다 크고 0.5보다 작으면서, type 컬럼이 'video'인 데이터의 갯수

import pandas as pd
df = pd.read_csv("fb.csv")

# print(df.head(3))
# print(df.info())

cond1 = ((df['loves'] + df['wows'])/df['reactions']) > 0.4
cond2 = ((df['loves'] + df['wows'])/df['reactions']) < 0.5
cond3 = df['type'] == 'video'

print(len(df[cond1&cond2&cond3]))

* 데이터 개수 : len(df[조건])

반응형

[문제3] date_added가 2018년 1월 이면서 country가 United Kingdom 단독 제작인 데이터의 갯수

import pandas as pd
df = pd.read_csv("nf.csv")

# print(df.info())
# print(df.head(3))
# print(df.shape)

df['date_added'] = pd.to_datetime(df['date_added'])

cond1 = df['date_added'].dt.year == 2018
cond2 = df['date_added'].dt.month == 1
cond3 = df['country'] == 'United Kingdom'

print(len(df[cond1 & cond2 & cond3]))

* 날짜타입으로 데이터 변경 : pd.to_datetime(df['컬럼명'])

* 년도 : df['컬럼명'].dt.year* 월 : df['컬럼명'].dt.month

 

 

320x100
반응형