Stigmatized./Investment Techniques

금융감독원의 금융통계월보를 이용한 통계분석

sosal 2015. 7. 15. 15:00
반응형

 

 

금융감독원에서는 금융통계데이터를 주기적으로 업데이트하여 e-Book 형태로 배포합니다.

링크: http://fisis.fss.or.kr/servlet/fss.fsi.id.svl.Ebook?scr_id=fssview04

 

 

 

 

 

 

월보 e-Book 으로 전체 데이터를 한번에 볼 수 있지만, 항목별로 웹에서 원하는 데이터를 지정하여 볼 수도 있습니다.

 

금융통계월보에는 다양한 통계데이터들이 담겨있습니다.

 

주요경제지표, 금융권역별 비교표, 은행, 보험 등 다양한 지표가 공개되어있으며 pdf파일 및 웹브라우저 E-Book 형태로 제공되기 때문에 누구나 이 지표를 다운받아서 활용할 수 있습니다.

 

 

 

- Figure 1. 금융통계월보 컨텐츠

 

 

이 지표에서 금융회사 포함범위는 다음과 같습니다.

 

- 금융지주회사

- 국내은행, 외국은행지점

- 종합금융회사, 상호저축은행, 신용협동조합, 여신전문금융회사

- 보험회사

- 투자매매 중개업자

 

각 항목의 자세한 사항은 E-Book에 나와 있으니 참조하시면 됩니다.

 

 

 

 

 

- 금융권역별 비교표 <총자산>을 활용하여 통계적 계산 해보기

 

 

 

- Figure 2. 금융감독원에서 제공하는 권역별 총자산 데이터

 

 

 

이러한 실제 데이터는 통계를 연습하거나 혹은 연구목적으로 사용하기 좋은 데이터들 입니다.

총자산은 은행, 생명보험회사, 여신전문금융회사, 신용카드사 등에서는 증가하는 모습을 보이는데

R programming을 이용하여 Linear regression으로 2016년의 자산을 예측해볼 수 있습니다.

 

 

- 금융감독원에서 제공하는 총자산 데이터로부터, 선형모델을 이용하여 2016년의 데이터 예측하기

 

각 총 자산은 선형성을 띈다는 가정 하에, 데이터들을 시간별로 묶고 선형 모델링을 해보면 다음과 같습니다.

- R programming source

 

> Time = c(2005:2015)
> Bank = c(1232070, 1394166, 1567813, 1871152, 1799816, 1841707,1969228, 2031268, 2101366, 2288339, 2349919)
> Life = c(234766, 265781, 297339, 320408, 361432, 408495, 442652, 547810, 597480, 662075, 685660)
> CFC = c(57959, 67827, 89714, 101627, 104074, 120774, 158763, 164907,174068, 185536, 185816)
> CCC = c(29487, 31928, 39261, 42722, 44434, 54461, 81735, 82393, 86463,92220, 91766)

> Asset_Info = data.frame(Time, Bank, Life, CFC, CCC)

 

 

 

 

 

# 시간에 따른 은행의 총자산의 변화

 

> plot(Asset_Info$Bank~Asset_Info$Time)
> model <- lm(Asset_Info$Bank~Asset_Info$Time)
> abline(model, col="red")


 

 

 

- Figure 3. 시간에 따른 은행의 총자산 변화 및 선형적합모델

 

 

 

은행권역의 년도별 총 자산 보유량 데이터의 plot figure 및 최소제곱합의 선형라인

총 자산은 선형성을 띄어 해가 갈수록 증가하는것을 알 수 있습니다.

 

 

이 모델의 summary를 이용하여 Interpretation을 해보면 다음과 같습니다.

 

 

- Figure 4. 시간 및 은행자산의 선형적합모델의 특성

 

 

i) Estimate: Coefficient of Linear regression for variable

선형모델의 coefficient로, 한 해가 지날 때 마다 은행의 총 자산의 증갸량을 의미합니다.

Intercept는 y 절편으로 선형모델의 상수값을 의미합니다.

 

 

ii) Std. Error: Standard deviation of the sampling distribution of the estimate of the coefficient.

여기서 말하는 Standard deviations은 standard errors로, 선형함수의 예측값보다 얼마나 더 떨어져있냐를 나타내는 수치입니다.

 

 

iii) T value: T-statistic, Testing whether Corresponding regression coefficient is different from 0

 

 

iV) Pr. : P-value for the hypothesis test for which the t value is the test statistic.

P-value가 8.28e-07로 아주 유의하게 나왔습니다. 즉 은행의 총 자산은 선형적으로 증가하고 있다는 걸 알 수 있습니다.

 

 

 

수준 95%를 이용하여 신뢰구간을 조사하면 다음과 같습니다.

 

 

- Figure 5. 95% 수준의 선형적합모델의 신뢰구간

 

 

 

 

따라서 Linear regression 결과, 방정식은 다음과 같습니다.

Asset = Coefficient * 년도 + Intercept

 

즉,

Asset_predict = 102330* Asset_Info$Time - 203823400

 

 

실제 데이터와 선형모델의 예측값 비교:

Time:         2005     2006      2007     2008      2009     2010      2011     2012     2013      2014     2015

Predict: 1348250 1450580 1552910 1655240 1757570 1859900 1962230 2064560 2166890 2269220 2371550
real:      1232070 1394166 1567813 1871152 1799816 1841707 1969228 2031268 2101366 2288339 2349919

 

 

어느정도 오차가 보이지만 이를 이용하여 2016년도의 총예산을 예측하면 다음과 같습니다.

Asset = 102330 * 2016 - 203823400 = 2473880

 

 

2016년에 이 값이 실제로 얼마나 들어맞는지, 신뢰구간 안에 속해있는지 등을 확인해 보면 좋은 통계실습이 될 것 같습니다.

 

 

 

은행 뿐 만 아니라 나머지 생명보험회사, 여신전문금융회사, 신용카드사에서도 선형적으로 증가하는 경향을 띄는지 linear modeling의 P-value 을 통해서 데이터로부터 만들어진 선형모델이 유의한 모델인지 분석해보고, 실제로 선형성을 띈다면 2016년, 혹은 그 이후의 총 자산도 예측할 수 있을 것입니다.

 

 

 

 

이처럼 금융기관에 대한 검사, 감독업무의 수행 결과로 다양한 통계자료를 공개하는 금융감독원의 노력을 통해 우리는 양질의 데이터를 얻을 수 있고, 그로부터 또 다른 다양한 데이터들을 생산해낼 수 있을 것입니다.