금융감독원에서는 금융통계데이터를 주기적으로 업데이트하여 e-Book 형태로 배포합니다.
링크: http://fisis.fss.or.kr/servlet/fss.fsi.id.svl.Ebook?scr_id=fssview04
월보 e-Book 으로 전체 데이터를 한번에 볼 수 있지만, 항목별로 웹에서 원하는 데이터를 지정하여 볼 수도 있습니다.
금융통계월보에는 다양한 통계데이터들이 담겨있습니다.
주요경제지표, 금융권역별 비교표, 은행, 보험 등 다양한 지표가 공개되어있으며 pdf파일 및 웹브라우저 E-Book 형태로 제공되기 때문에 누구나 이 지표를 다운받아서 활용할 수 있습니다.
- Figure 1. 금융통계월보 컨텐츠
이 지표에서 금융회사 포함범위는 다음과 같습니다.
- 금융지주회사
- 국내은행, 외국은행지점
- 종합금융회사, 상호저축은행, 신용협동조합, 여신전문금융회사
- 보험회사
- 투자매매 중개업자
각 항목의 자세한 사항은 E-Book에 나와 있으니 참조하시면 됩니다.
- 금융권역별 비교표 <총자산>을 활용하여 통계적 계산 해보기
- Figure 2. 금융감독원에서 제공하는 권역별 총자산 데이터
이러한 실제 데이터는 통계를 연습하거나 혹은 연구목적으로 사용하기 좋은 데이터들 입니다.
총자산은 은행, 생명보험회사, 여신전문금융회사, 신용카드사 등에서는 증가하는 모습을 보이는데
R programming을 이용하여 Linear regression으로 2016년의 자산을 예측해볼 수 있습니다.
- 금융감독원에서 제공하는 총자산 데이터로부터, 선형모델을 이용하여 2016년의 데이터 예측하기
각 총 자산은 선형성을 띈다는 가정 하에, 데이터들을 시간별로 묶고 선형 모델링을 해보면 다음과 같습니다.
- R programming source
> Time = c(2005:2015)
> Bank = c(1232070, 1394166, 1567813, 1871152, 1799816, 1841707,1969228, 2031268, 2101366, 2288339, 2349919)
> Life = c(234766, 265781, 297339, 320408, 361432, 408495, 442652, 547810, 597480, 662075, 685660)
> CFC = c(57959, 67827, 89714, 101627, 104074, 120774, 158763, 164907,174068, 185536, 185816)
> CCC = c(29487, 31928, 39261, 42722, 44434, 54461, 81735, 82393, 86463,92220, 91766)
> Asset_Info = data.frame(Time, Bank, Life, CFC, CCC)
# 시간에 따른 은행의 총자산의 변화
> plot(Asset_Info$Bank~Asset_Info$Time)
> model <- lm(Asset_Info$Bank~Asset_Info$Time)
> abline(model, col="red")
- Figure 3. 시간에 따른 은행의 총자산 변화 및 선형적합모델
은행권역의 년도별 총 자산 보유량 데이터의 plot figure 및 최소제곱합의 선형라인
총 자산은 선형성을 띄어 해가 갈수록 증가하는것을 알 수 있습니다.
이 모델의 summary를 이용하여 Interpretation을 해보면 다음과 같습니다.
- Figure 4. 시간 및 은행자산의 선형적합모델의 특성
i) Estimate: Coefficient of Linear regression for variable
선형모델의 coefficient로, 한 해가 지날 때 마다 은행의 총 자산의 증갸량을 의미합니다.
Intercept는 y 절편으로 선형모델의 상수값을 의미합니다.
ii) Std. Error: Standard deviation of the sampling distribution of the estimate of the coefficient.
여기서 말하는 Standard deviations은 standard errors로, 선형함수의 예측값보다 얼마나 더 떨어져있냐를 나타내는 수치입니다.
iii) T value: T-statistic, Testing whether Corresponding regression coefficient is different from 0
iV) Pr. : P-value for the hypothesis test for which the t value is the test statistic.
P-value가 8.28e-07로 아주 유의하게 나왔습니다. 즉 은행의 총 자산은 선형적으로 증가하고 있다는 걸 알 수 있습니다.
수준 95%를 이용하여 신뢰구간을 조사하면 다음과 같습니다.
- Figure 5. 95% 수준의 선형적합모델의 신뢰구간
따라서 Linear regression 결과, 방정식은 다음과 같습니다.
Asset = Coefficient * 년도 + Intercept
즉,
Asset_predict = 102330* Asset_Info$Time - 203823400
실제 데이터와 선형모델의 예측값 비교:
Time: 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
Predict: 1348250 1450580 1552910 1655240 1757570 1859900 1962230 2064560 2166890 2269220 2371550
real: 1232070 1394166 1567813 1871152 1799816 1841707 1969228 2031268 2101366 2288339 2349919
어느정도 오차가 보이지만 이를 이용하여 2016년도의 총예산을 예측하면 다음과 같습니다.
Asset = 102330 * 2016 - 203823400 = 2473880
2016년에 이 값이 실제로 얼마나 들어맞는지, 신뢰구간 안에 속해있는지 등을 확인해 보면 좋은 통계실습이 될 것 같습니다.
은행 뿐 만 아니라 나머지 생명보험회사, 여신전문금융회사, 신용카드사에서도 선형적으로 증가하는 경향을 띄는지 linear modeling의 P-value 을 통해서 데이터로부터 만들어진 선형모델이 유의한 모델인지 분석해보고, 실제로 선형성을 띈다면 2016년, 혹은 그 이후의 총 자산도 예측할 수 있을 것입니다.
이처럼 금융기관에 대한 검사, 감독업무의 수행 결과로 다양한 통계자료를 공개하는 금융감독원의 노력을 통해 우리는 양질의 데이터를 얻을 수 있고, 그로부터 또 다른 다양한 데이터들을 생산해낼 수 있을 것입니다.
'Stigmatized. > Investment Techniques' 카테고리의 다른 글
구글 애널리틱스 블로그분석, 티스토리 사용하기 (0) | 2015.12.13 |
---|---|
크라우드 펀딩, p2p 대출, 한번 더 고민해보세요. (0) | 2015.12.05 |
Moral hazard, 모랄해저드와 마케팅 (0) | 2015.04.19 |
HB 테크놀러지 추가상장과 주가 (0) | 2015.02.25 |
증권계좌 개설하는법, 주식투자 하는법 (0) | 2015.02.07 |