반응형

Programing/R- programming 58

R - unable to open connection to X11 display.

R 프로그래밍에서 이미지 파일을 생성하는 함수는 png, jpeg, pdf.. 기타 등등이 있습니다. > png("test.png") Error in .External2(C_X11, paste("png::", filename, sep = ""), g$width, : unable to start device PNG In addition: Warning message: In png("test.png") : unable to open connection to X11 display. 서버에서 Data visualizing를 할 때, 항상 겪는 에러인데, 매번 찾는것이 귀찮아서 이참에 정리해보려고 합니다. capabilities {base} R Documentation Report Capabilities of t..

R - Linux에서 tar.gz 파일로부터 패키지 설치하기

/* * http://sosal.kr/ * made by so_Sal */ 패키지중에, CRAN repository에서 삭제되는 경우가 종종 있습니다.Package ‘~~’ was removed from the CRAN repository. 이런 경우, install.package() 함수로 설치를 하려고 보면다음과 같은 Warning message와 함께 패키지가 설치되지 않습니다. Warning message: package ‘~~’ is not available (for R version 3.2.1) > 패키지가 사라졌거나, 혹은 인터넷이 안되거나.. 겠습니다. 보통 이런경우 tar.gz 파일로 패키지 파일을 제공하는 곳에서wget으로 파일을 받은 후, CMD 명령어, 혹은 install.packa..

R - rJava 설치 에러날 때

/* * http://sosal.kr/ * made by so_Sal */ 특정 R 패키지를 설치하는데, rJava dependency 때문에 설치가 불가능했다. ERROR: configuration failed for package ‘rJava’ * removing ‘/storage/home/sosal/programs/R/R-devel/library/rJava’ 그래서 rJava를 설치하려고 했지만.. > install.packages("rJava") --- Please select a CRAN mirror for use in this session --- CRAN mirror ERROR: configuration failed for package ‘rJava’ * removing ‘/storage/h..

R - 반복측정(paired) 자료의 분석

/* * http://sosal.kr/ * made by so_Sal */ 반복측정 자료 (짝지은 자료) - 동일한 대상자에 대하여 어떤 사건 전과 사건 후의 측정-재측정 (반복측정) 자료의 분석 - 짝지은 환자 대조군 연구: 한 환자에 대해 환자가 아닌 비교군을 짝지은 경우의 분석 예) - 동일한 사람의 신체 두 부위 비교 - 유전적 일치성을 가진 대상에서 질병 or 요인을 볼 때 - 다른 대상이지만 결과에 영향을 주는 교란요인을 동일하게 하기 위해 짝을 짓는 경우 - 허리 통증이 있는 환자에게 진통제 투여는 효과가 있는가? * Paired T-test- 치료 전과 치료 후의 difference를 보기위함짝지어진 값들 간 차이(Difference)를 구한 후, 차이의 평균=0 인지 검정독립표본 T-te..

R을 이용한 데이터 이상치 검출법 정리

/* * http://sosal.kr/ * made by so_Sal */ - 이상치 통계에서는 데이터 샘플에서 관찰된 한 값이 다른 관측값과 거리가 있을 때 이상치(outlier)라고 한다. 측정에 있어서 데이터들의 가변성, 변동성(variability) 때문일 수 있고 실제로 잘못된 실험에 의한 에러일 수 있다. 후자의 경우에는 분명히 데이터 분석 이전에 outlier를 제거를 해야한다. 이 포스팅에서는 이상치를 검출하는 알고리즘들을 R프로그래밍의 패키지를 이용하여 알아보고자 한다. 0. Data sampling 다양한 이상치 검출 테스트를 하기 전에, 이상치가 포함된 데이터를 만들고자 한다. 1) 데이터 생성 normal distribution에 속하는 데이터를 100개 생성하고, 매우 작은 데이터..

R ggplot 누적분포 및 계단형 그래프 그리기

/* * http://sosal.kr/ * made by so_Sal */ R에서 ggplot을 이용하여 그래프를 그려보고, 누적그래프를 그려보고, 계단형 누적그래프를 그려보도록 하겠습니다. 라이브러리 설치 & 불러오기 - 라이브러리 설치 > install.packages("reshape") > install.packages("reshape2") > install.packages("ggplot2") - 라이브러리 불러오기 > library(reshape) > library(ggplot2) - 랜덤 샘플링으로 데이터 만들기 day

R - graph (Network) plot, 네트워크 그래프

/* * http://sosal.kr/ * made by so_Sal */ - Graph data 그래프 데이터의 표현방식은 다양하다. 1. Adjacency matrix (인접행렬) # 데이터는 아무런 의미가 없는, 제가 마음대로 만든 matrix 입니다. ALK AMN DMRTA1 SOX2 PCDHA8 OR52A5 IQCB1 ALK 0 1 0 1 0 1 0 AMN 1 0 1 1 0 1 0 DMRTA1 0 1 0 0 0 0 0 SOX2 1 1 0 0 1 1 0 PCDHA8 0 0 0 1 0 1 0 OR52A5 1 1 0 1 1 0 1 IQCB1 0 0 0 0 0 1 0 인접행렬은 column, row의 구성이 같아야 하며 n by n matrix를 이룬다. 따라서 column, row에 있는 목록이 곧..

R에서 특정 문자, 문자열 제거하기

/* * http://sosal.kr/ * made by so_Sal */ find0 라는 파일에 integer pair가 저장되어 있는데 끝에 " 라는 문자때문에 프로그래밍 안에서 바로 연산을 할 수 없는 상황이었습니다. [sosal@sosalr tmp]$ head ./find0 8 1540" 8 3436" 8 3454" 8 6484" 8 6760" 8 7291" 8 7921" 8 7984" 8 10331" 8 10993" pair head(pair) V1 V2 1 8 1540" 2 8 3436" 3 8 3454" 4 8 6484" 5 8 6760" 6 8 7291" > typeof(pair[1,1]) [1] "integer" > typeof(pair[1,2]) [1] "character" > inte..

다중회귀 LASSO regression, selection과 shrinkage

/* * http://sosal.kr/ * made by so_Sal */ 이 글은 제가 공부하며 썼던 내용이라, 지금 보니 너무 허접해서새롭게 포스팅해봤습니다. Ridge, Lasso regularization을 공부하고 싶으신 분은 아래 링크를 보시길 추천드립니다.http://sosal.kr/1104 --------------------------------------------------------- 연구나 실험 등, 다양한 분야에 걸쳐서 '모형의 단순화'는 매우 중요하다. 간결함의 원리(principle of parsimony)는 어떤 실험 결과나 현상에 대해 설명할 수 있는 변수들이 많은 경우, 그것을 가장 잘 설명할 수 있는 변수는 결국 '간단한 설명' 혹은 '최소한의 설명'이 된다는 것이다...

카플란 메이어 (kaplan meier) 생존분석 - R

/* * http://sosal.kr/ * made by so_Sal */ 카플란메이어 생존 분포는 샘플에서 사망이 발생함에 따라 누적되는 형태의 계단형태 생존곡선을 나타낸다. 생존분석에서의 반응변수 (종속변수)는 결국 해당 시간에 생존률이 얼마가 되는지를 나타낸다. 1. Kaplan meier 기본 함수 및 사용방법 - survival 패키지 다운로드 - 환자의 생존상태 식별하기 (surv 함수) - 시간에 따른 생존커브 구하기 (survfit) - Cumulative hazard 그래프 그리기 - 다중 생존곡선 그리기 2. 공개데이터 colon을 이용한 kaplan meier 생존분석 - colon 전체데이터의 생존곡선 구하기 - 성별에 따른 다중 생존곡선 구하기 - rx 치료법에 따른 다중 생존곡선..

반응형