반응형

Programing 145

R: Chisq post hoc. 다중 카이제곱검정

/* * http://sosal.kr/ * made by so_Sal */ R 프로그래밍에서 독립성 검정을 하는데, 3군 이상의 경우에는, 카이제곱에서 어떤 그룹간의 차이가 있는지 알 수 없다. 찾아보니까 다중 카이제곱 검정을 해주는 패키지가 있었다. library: fifer 설치 (install) > install.packages("fifer") 로드 > library(fifer) - 데이터 예쩨 > M dimnames(M) chisq.post.hoc(M) 결과값과 raw pvalue, adjust p-value (default FDR) FDR 값으로 multiple testing 결과 adjust pvalue값까지 나오는 것을 확인할 수 있다.

Visual studio에서 R studio를 사용해보자

/* * http://sosal.kr/ * made by so_Sal */ Microsoft가 레볼루션 에널리틱스를 인수했다는 사실만 알고 있었는데, 드디어 Visual studio에서 지원하게 되었다. 언제나 IDE(integrated development environment) 에서 아쉬움을 느껴 왔는데, Visual studio에서 작업할 수 있게 되어 코딩이나 디버깅, 프로젝트 관리 등등 편리하게 작업할 수 있을 것 같다. 비록 데이터 분석을 실제로 사용하는 환경은 대부분 서버이지만, 구현하는 과정에서는 도움이 많이 될 것 같다. - 다운로드 및 관련 정보 https://www.visualstudio.com/features/rtvs-vs Visual studio가 있다면 추가 패키지를 설치만 해주..

R - unable to open connection to X11 display.

R 프로그래밍에서 이미지 파일을 생성하는 함수는 png, jpeg, pdf.. 기타 등등이 있습니다. > png("test.png") Error in .External2(C_X11, paste("png::", filename, sep = ""), g$width, : unable to start device PNG In addition: Warning message: In png("test.png") : unable to open connection to X11 display. 서버에서 Data visualizing를 할 때, 항상 겪는 에러인데, 매번 찾는것이 귀찮아서 이참에 정리해보려고 합니다. capabilities {base} R Documentation Report Capabilities of t..

R - Linux에서 tar.gz 파일로부터 패키지 설치하기

/* * http://sosal.kr/ * made by so_Sal */ 패키지중에, CRAN repository에서 삭제되는 경우가 종종 있습니다.Package ‘~~’ was removed from the CRAN repository. 이런 경우, install.package() 함수로 설치를 하려고 보면다음과 같은 Warning message와 함께 패키지가 설치되지 않습니다. Warning message: package ‘~~’ is not available (for R version 3.2.1) > 패키지가 사라졌거나, 혹은 인터넷이 안되거나.. 겠습니다. 보통 이런경우 tar.gz 파일로 패키지 파일을 제공하는 곳에서wget으로 파일을 받은 후, CMD 명령어, 혹은 install.packa..

R - rJava 설치 에러날 때

/* * http://sosal.kr/ * made by so_Sal */ 특정 R 패키지를 설치하는데, rJava dependency 때문에 설치가 불가능했다. ERROR: configuration failed for package ‘rJava’ * removing ‘/storage/home/sosal/programs/R/R-devel/library/rJava’ 그래서 rJava를 설치하려고 했지만.. > install.packages("rJava") --- Please select a CRAN mirror for use in this session --- CRAN mirror ERROR: configuration failed for package ‘rJava’ * removing ‘/storage/h..

R - 반복측정(paired) 자료의 분석

/* * http://sosal.kr/ * made by so_Sal */ 반복측정 자료 (짝지은 자료) - 동일한 대상자에 대하여 어떤 사건 전과 사건 후의 측정-재측정 (반복측정) 자료의 분석 - 짝지은 환자 대조군 연구: 한 환자에 대해 환자가 아닌 비교군을 짝지은 경우의 분석 예) - 동일한 사람의 신체 두 부위 비교 - 유전적 일치성을 가진 대상에서 질병 or 요인을 볼 때 - 다른 대상이지만 결과에 영향을 주는 교란요인을 동일하게 하기 위해 짝을 짓는 경우 - 허리 통증이 있는 환자에게 진통제 투여는 효과가 있는가? * Paired T-test- 치료 전과 치료 후의 difference를 보기위함짝지어진 값들 간 차이(Difference)를 구한 후, 차이의 평균=0 인지 검정독립표본 T-te..

R을 이용한 데이터 이상치 검출법 정리

/* * http://sosal.kr/ * made by so_Sal */ - 이상치 통계에서는 데이터 샘플에서 관찰된 한 값이 다른 관측값과 거리가 있을 때 이상치(outlier)라고 한다. 측정에 있어서 데이터들의 가변성, 변동성(variability) 때문일 수 있고 실제로 잘못된 실험에 의한 에러일 수 있다. 후자의 경우에는 분명히 데이터 분석 이전에 outlier를 제거를 해야한다. 이 포스팅에서는 이상치를 검출하는 알고리즘들을 R프로그래밍의 패키지를 이용하여 알아보고자 한다. 0. Data sampling 다양한 이상치 검출 테스트를 하기 전에, 이상치가 포함된 데이터를 만들고자 한다. 1) 데이터 생성 normal distribution에 속하는 데이터를 100개 생성하고, 매우 작은 데이터..

R ggplot 누적분포 및 계단형 그래프 그리기

/* * http://sosal.kr/ * made by so_Sal */ R에서 ggplot을 이용하여 그래프를 그려보고, 누적그래프를 그려보고, 계단형 누적그래프를 그려보도록 하겠습니다. 라이브러리 설치 & 불러오기 - 라이브러리 설치 > install.packages("reshape") > install.packages("reshape2") > install.packages("ggplot2") - 라이브러리 불러오기 > library(reshape) > library(ggplot2) - 랜덤 샘플링으로 데이터 만들기 day

python - unicodedecodeerror 'ascii' codec can't decode byte

/* * http://sosal.kr/ * made by so_Sal */ 파이썬에서 file.readline() 함수 에러가 났다. Traceback (most recent call last): File "/mnt/fhgfs/sosal/TCGA/Source/bin/get_integrate_somatics_onlyone.py", line 28, in line = PR_file.readline() File "/storage/home/sosal/anaconda3/lib/python3.4/encodings/ascii.py", line 26, in decode return codecs.ascii_decode(input, self.errors)[0] UnicodeDecodeError: 'ascii' codec c..

R - graph (Network) plot, 네트워크 그래프

/* * http://sosal.kr/ * made by so_Sal */ - Graph data 그래프 데이터의 표현방식은 다양하다. 1. Adjacency matrix (인접행렬) # 데이터는 아무런 의미가 없는, 제가 마음대로 만든 matrix 입니다. ALK AMN DMRTA1 SOX2 PCDHA8 OR52A5 IQCB1 ALK 0 1 0 1 0 1 0 AMN 1 0 1 1 0 1 0 DMRTA1 0 1 0 0 0 0 0 SOX2 1 1 0 0 1 1 0 PCDHA8 0 0 0 1 0 1 0 OR52A5 1 1 0 1 1 0 1 IQCB1 0 0 0 0 0 1 0 인접행렬은 column, row의 구성이 같아야 하며 n by n matrix를 이룬다. 따라서 column, row에 있는 목록이 곧..

반응형