반응형

전체 글 805

R을 이용한 데이터 이상치 검출법 정리

/* * http://sosal.kr/ * made by so_Sal */ - 이상치 통계에서는 데이터 샘플에서 관찰된 한 값이 다른 관측값과 거리가 있을 때 이상치(outlier)라고 한다. 측정에 있어서 데이터들의 가변성, 변동성(variability) 때문일 수 있고 실제로 잘못된 실험에 의한 에러일 수 있다. 후자의 경우에는 분명히 데이터 분석 이전에 outlier를 제거를 해야한다. 이 포스팅에서는 이상치를 검출하는 알고리즘들을 R프로그래밍의 패키지를 이용하여 알아보고자 한다. 0. Data sampling 다양한 이상치 검출 테스트를 하기 전에, 이상치가 포함된 데이터를 만들고자 한다. 1) 데이터 생성 normal distribution에 속하는 데이터를 100개 생성하고, 매우 작은 데이터..

화이트 하프문 베타 20큐브에 키우는중..

/* * http://sosal.kr/ * made by so_Sal */ 20큐브 어항에 하프문 베타를 키우고 있습니다. 이렇게 한달쯤 전에 구입한 20큐브와 걸이식 여과기.. 어항조명 바로 밑에서 찍어서 파랗게 나왔는데 훨씬 이쁘네요. 딱히 플레어링 하는 모습은 아닌데 우연히 예쁘게 찍혔습니다. 귀욤귀욤 하네요.. 플레어링 하는모습.. 오히려 평소랑 별로 차이없는듯 ㅋㅋ 조명 없을 때 모습입니다 ㅎㅎ. 그리고 영상!

Stigmatized./Fish 2015.10.16

Putty에서 mysql encoding 한글이 깨질 때

/* * http://sosal.kr/ * made by so_Sal */ * Mysql character set (Encoding) 보는법 mysql> show variables like 'c%'; 사용자 환경설정이 모두 latin으로 되어있다. * Table structure information 보는법 mysql> show create table member; 사용자 환경 character set 역시 latin1이고, 테이블의 charset 역시 latin1인데 막상 한글이 들어가있는 테이블의 내용을 select로 보면 글자는 다 깨진다. 그럴 경우 PuTTY의 Character set을 바꿔줘야 한글이 잘 보인다. Window - Translation 탭에서 Character-set을 ISO-8..

Javascript table filter 라이브러리

/* * http://sosal.kr/ * made by so_Sal */ Javascript로 HTML의 Table에서 수식으로 filtering이 가능하도록 하는 라이브러리 입니다. 아래 3가지 파일이 실제 라이브러리 파일이 있습니다. images_path: 'https://koalyptus.github.io/TableFilter/tablefilter/style/themes/' 이미지도 있어서 github에서 끌어와서 쓰는게 제일 편하겠네요. github가 영원히 망하지 않아야 이런 라이브러리를 계속 쓸 수 있을 텐데요 ^^;; 아래 소스 긁어서 쓰시면 됩니다.

R ggplot 누적분포 및 계단형 그래프 그리기

/* * http://sosal.kr/ * made by so_Sal */ R에서 ggplot을 이용하여 그래프를 그려보고, 누적그래프를 그려보고, 계단형 누적그래프를 그려보도록 하겠습니다. 라이브러리 설치 & 불러오기 - 라이브러리 설치 > install.packages("reshape") > install.packages("reshape2") > install.packages("ggplot2") - 라이브러리 불러오기 > library(reshape) > library(ggplot2) - 랜덤 샘플링으로 데이터 만들기 day

bayes rule - 베이즈 정리

/* * http://sosal.kr/ * made by so_Sal */ 통계 데이터는 다음과 같이 주어졌다고 가정해보자. 유방 X선 검사는 유방암을 진단하는 척도로 사용된다. 10명의 양성반응을 일으키는 여성에서는 1명이 실제로 유방암을 진단받았고, 10만명의 음성반응을 일으키는 여성에서 20명만이 유방암을 진단받았다. 우리는 모든 모집단 정보를 가지고 있기 때문에, 사전확률과 사후확률을 모두 쉽게 구할 수 있다. 사전 확률: 유방암을 진단받기 이전에 유방암을 가질 확률 = (1+20) / (1+20+9+99980) = 21/100010 = 0.000209979.. (즉 0.0209979%) 사후 확률: 유방암에 양성반응으로 진단받은 후에, 유방암을 가질 확률 = (1/9+1) = 1/10 = 0.1..

snpEff: predicting the effects of SNP

/* * http://sosal.kr/ * made by so_Sal */ http://snpeff.sourceforge.net/ Cingolani, Pablo, et al. "A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3." Fly 6.2 (2012): 80-92. variant의 position, allele 정보를 주면 얼마나 위험한지 HIGH / MODERATE / LOW 3가지로 분류해줍니다. (그 외 MODIFIER) A high impact..

affymetrix cdf 파일, 아무리 찾아도 없다

/* * http://sosal.kr/ * made by so_Sal */ Microarray로 분석을 하고있었다. chip type: HuGene-2_0-st로 작업을 하고 있기에, Affymetrix Power Tool (APT)를 사용하기 위해서는 cdf파일이 input으로 들어가는 상황이었다. - Affymetrix library 파일을 받을 수 있는곳 http://www.affymetrix.com/support/technical/byproduct.affx?product=hugene-1_0-st-v1 그러나 library 파일을 아무리 다운받아봐도 cdf파일이 없었다. bgp, cif, clf, grc, mps, pgf, ps, qcc, smd.. 뭐 이런파일들은 있는데.. 나와 비슷한 사람들이 ..

VEGF-A Expression correlates with TP53 mutations in NSCLC

/* * http://sosal.kr/ * made by so_Sal */ Schwaederlé, Maria, et al. "VEGF-A Expression Correlates with TP53 Mutations in Non–Small Cell Lung Cancer: Implications for Antiangiogenesis Therapy." Cancer research 75.7 (2015): 1187-1190. INTRODUCTION Bevacizumab은 항암제로서 종양에 있어서 많이 사용되는 약물이며 Vascular endothelial growth factor-A (VEGF-A)을 대상으로 한다. Carboplatin, paclitaxel과 결합된 치료법은 실제로 화학요법만 사용했을 때의 생존인..

Microsoft Evangelists 활동~

/* * http://sosal.kr/ * made by so_Sal */ 요즘 짬내서 Microsoft student partner 프로그램에서 활동하고 있습니다. Evangelist라고.. 뭐 직역하자면 전도사? .. 마냥 마이크로소프트의 기술들을 홍보하는.. 뭐 서포터즈 개념으로 보면 되겠네요 ㅎㅎ 다양한 기술들을 회사에서 학생들에게 알려주고, 그 기술을 습득하고 그걸 또 다양한 사람들에게 전달하는 역할이라고 보시면 되겠습니다. http://microsoftstudents.com/ 이렇게 도메인도 사고.. 가지고있는 조그마난 서버에 웹사이트도 올려보고 ^^ 팀원들의 실명이 있어서 불안하긴 하지만.. 뭐 개인정보는 없으니 올려봅니다 ㅋㅋ. 혹시 검색타고 들어오면 혼날것 같기도 하네요.. 아무렴, 대학..

Stigmatized./Essay 2015.09.25
반응형