반응형

Programing 146

다중회귀 LASSO regression, selection과 shrinkage

/* * http://sosal.kr/ * made by so_Sal */ 이 글은 제가 공부하며 썼던 내용이라, 지금 보니 너무 허접해서새롭게 포스팅해봤습니다. Ridge, Lasso regularization을 공부하고 싶으신 분은 아래 링크를 보시길 추천드립니다.http://sosal.kr/1104 --------------------------------------------------------- 연구나 실험 등, 다양한 분야에 걸쳐서 '모형의 단순화'는 매우 중요하다. 간결함의 원리(principle of parsimony)는 어떤 실험 결과나 현상에 대해 설명할 수 있는 변수들이 많은 경우, 그것을 가장 잘 설명할 수 있는 변수는 결국 '간단한 설명' 혹은 '최소한의 설명'이 된다는 것이다...

카플란 메이어 (kaplan meier) 생존분석 - R

/* * http://sosal.kr/ * made by so_Sal */ 카플란메이어 생존 분포는 샘플에서 사망이 발생함에 따라 누적되는 형태의 계단형태 생존곡선을 나타낸다. 생존분석에서의 반응변수 (종속변수)는 결국 해당 시간에 생존률이 얼마가 되는지를 나타낸다. 1. Kaplan meier 기본 함수 및 사용방법 - survival 패키지 다운로드 - 환자의 생존상태 식별하기 (surv 함수) - 시간에 따른 생존커브 구하기 (survfit) - Cumulative hazard 그래프 그리기 - 다중 생존곡선 그리기 2. 공개데이터 colon을 이용한 kaplan meier 생존분석 - colon 전체데이터의 생존곡선 구하기 - 성별에 따른 다중 생존곡선 구하기 - rx 치료법에 따른 다중 생존곡선..

R을 이용하여 엑셀(excel) 파일 읽고 쓰기

/* * http://sosal.kr/ * made by so_Sal */ Informatics 하는 사람의 입장에서 MS-office Excel을 쓴다는건 영 환영받지 못할 일이다. 소수점 처리에 문제가 많으며, 빅데이터의 경우 열람이 굉장히 힘들고 느리고, 제한적이기 때문이다. 하지만 작은 데이터의 경우, 쉽게 통계적으로 그래프를 그린다거나 눈으로 쉽게 볼 수 있기 때문에 활용도가 높다. 적당히 콘솔로 보기 힘들지만, 엑셀로 GUI로 볼 때 편한 데이터의 경우 Excel 파일로 열람하거나 혹은 엑셀(Excel)로 저장되어있는 데이터를 불러 올 때 gdata 패키지를 쓴다면 R에서도 쉽게 Excel과 연동이 가능하다. - 공식 gdata 패키지 문서 http://cran.r-project.org/web..

R을 이용한 기본 Linear regression 선형회귀

/* * http://sosal.tistory.com/ * made by so_Sal */ - '선형회귀' 란 무엇인가? - 데이터 준비 - 선형 회기모델로 최적선 구하기 - 선형회귀 결과해석 및 단순 예측 - 분산분석 - 신뢰구간과 예측 - '선형회귀' 란 무엇인가? - (X1, X2, …, Xn)을 n차원의 확률 변수로 하여 조건부 기댓값 - 하나의 설명 변수에 기반한 경우에는 단순선형회귀, 둘 이상의 복수의 설명 변수에 기반한 경우에는 다중선형회귀라고 한다. [네이버 지식백과] 선형 회귀 분석 [linear regression] 단순 선형회귀를 기준으로 y = ax + b 라는 회귀 함수 (회귀 곡선) 를 구하여 독립변수(x)에 따른 종속변수(y)값을 예측하는 모델링이라고 할 수 있겠습니다. 간단하..

리눅스에서 R 가로넓이 조절하기

/* * http://sosal.kr/ * made by so_Sal */ 서버: Linux CentOS 리눅스에서 R을 쓰게되면, 처음에 가로 넓이가 짧아서 답답하게 느껴질 것입니다. 모니터는 충분 하지만, 리눅스의 R 자체에서 witdh 길이가 제한되어있기 때문에, 모니터를 충분히 사용하지 못하고 있죠. 이 경우에, options() 이란 함수를 사용하면 됩니다. https://stat.ethz.ch/R-manual/R-patched/library/base/html/options.html 가로 넓히기: options("width"=300) 이 명령어 한방이면 끝! options() 함수에서 "width" parameter를 조절 한 후의 같은 명령어 결과 모습. 모니터 전체의 넓이를 모두 활용할 수 ..

R - One sample T-test / T 검정

/* * http://sosal.kr/ * made by so_Sal */ T검정을 검색했을 떄, 백과사전이나 위키에서 나오는 내용을 요약하면 다음과 같다. - Introduction T검정이란? - t 검정은 표본으로부터 추정된 분산이나 표준편차를 가지고 아래에 있는 두 가설을 검정하는 방법 H0(귀무가설): 두 모집단은 평균간의 차이가 없다. H1(대립가설): 두 모집단은 평균간의 차이가 있다. 결론은 비교하는 두 대상의 평균의 차이가 있느냐, 없느냐다. 그렇다면 one sample t-test 란 무엇일까? - one sample t-test 전체 모집단에 대한 정보가 없을 때, 표본이 과연 모집단으로부터 나온것인지를 판단할 때 사용한다. - t.test 문법 t.test(x, y = NULL, a..

IQR Rule for Outliers - 이상치

/* * http://sosal.kr/ * made by so_Sal */ 이상치가 보일만한 boxplot 그림을 완성하기 위해, sample과 직접 데이터를 추가해서 이상치를 가지는 데이터 a를 만들었다. a 이상치 (낮은값) > which(a 이상치 (높은값) > which(a > fivenum(a)[4] + 1.5*IQR(a)) [1] 103 104 따라서 a[101], a[102]가 이상치 (낮은값) a[103], a[104]가 이상치 (높은값) 이 되겠습니다. a의 101, 102번 index가 낮은 값의 이상치로 판별됨 a의 103, 104번 index가 높은 값의 이상치로 판별됨 Q3 + 1.5*IQR 보다 크거..

윈도우 자동종료 타이머 프로그램

/* * http://sosal.kr/ * made by so_Sal */ 윈도우 자동종료 프로그램, 아주 가볍고 간단하게 구현했습니다. 사용자 윈도우설정에 맞게 윈도우폼 색이 변경됩니다. Hour: 시간 Min: 분 Sec: 초 위에 입력한 시간 이후에 Start 버튼을 누르시면 타이머는 시작되며모든 시간이 지난 이후에 자동으로 컴퓨터는 종료됩니다. 혹시 저장하지 않은 프로그램이 있다면 주의해주세요! 자동종료 프로그램 다운로드 이용해주셔서 감사합니다~ ^^

No CPU/ABI system image available for this target

/* * http://sosal.kr/ * made by so_Sal */ 안드로이드 프로그래밍 환경설정에서, Virtual device를 추가할 때 다들 한번쯤은 보시는 에러입니다. No CPU/ABI system image available for this target 이 경우에, CPU/ABI: 탭에 No system images installed for this target. 이라고 나옵니다.Target: Android 4.4W 는 API Level 20 패키지들이 필요하기 때문이죠. 이를 해결하기 위해 "SDK manager.exe" 를 실행하여, 해당 패키지를 설치해주시면 됩니다. 저의 경우에는 API Level 20 패키지가 필요하기 때문에, SDK Manager에서 API 20을 설치해주었..

반응형