R에서 ROC curve 그리기

/* * http://sosal.kr/ * made by so_Sal */ R 프로그래밍에서 Logistic regression, SVM, 혹은 딥러닝 결과 등을 정리할 때ROC curve와 AUC를 계산하기 위해서 매번 pROC, ROCR 등의 라이브러리로허접한 기본 figure들을 만들었었다. 항상 찝찝한 마음으로 기본적인 figure를 그리다가..오늘 찾아보니 Epi라는 패키지를 쓰면 매우 쉽게 좋은 ROC curve 그래프를 그릴 수 있다는 것을 발견했다. install.packages("Epi")간단하게 설치해주고.. library(Epi) ROC(predicted, label) # also try adding plot="sp"코드 한줄이면 그래프가 그려진다. ex) library(Epi) pr..

scikit-image 설치 에러 Microsoft visual c++ 14.0 required

Failed building wheel for scikit-image Running setup.py clean for scikit-imageFailed to build scikit-imageInstalling collected packages: scikit-image Running setup.py install for scikit-image ... error ..... compiling C sources error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools ######## Solution ..

python scipy - ImportError: DLL load failed

진짜 scipy 안에 있는 모듈을 import 할 때, DLL이 없다고 에러가 난다. 구글링 해서 Stack-overflow 같은 곳에서는 NumPy+MKL 를 설치하라고 난리다.해당 파일은 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 에서 다운받아서 설치할 수 있지만,본인은 아무리 Numpy, scipy를 지우고 NumPy+MKL을 따로 받아 설치하고 해도scipy는 import 되는데, 안에있는 sub-module에 대해서는 DLL error가 발생했다. >>> import scipy# scipy는 잘 import 됨. >>> import scipy.miscTraceback (most recent call last): File "", line 1, in File "C:..

python DICOM (DCM) 이미지를 png, jpg로 바꾸기

DICOM 이미지를 이용해서 학습을 하려고, jpg나 png format으로 바꾸려고 했는데,예전에 어떤 library를 썼는지 잘 기억이 안나서.. 구글링해보니 mritopng 라는 정말 간단한 패키지가 있어서, 혹시 까먹을까봐 포스팅으로 남겨본다. https://github.com/danishm/mritopng 위 github에서 zip 파일 다운받아서 압축을 풀고,콘솔에서 python setup.py install 하나로 설치 완료. 혹은 pip install mritopng convert_file이란 함수로 파일 이름 하나하나 짚어가면서 바꿀 수 있고,convert_folder 함수로 폴더 안에있는 모든 dicom 파일을 (DCM) png로 바꿀 수 있다. import mritopng # Conv..

Tensorflow-gpu No module named '_pywrap_tensorflow' 에러

return _bootstrap._gcd_import(name[level:], package, level) File "", line 986, in _gcd_import File "", line 969, in _find_and_load File "", line 958, in _find_and_load_unlocked File "", line 666, in _load_unlocked File "", line 577, in module_from_spec File "", line 906, in create_module File "", line 222, in _call_with_frames_removed ImportError: DLL load failed: Impossibile trovare il modulo s..

통계, 데이터 정리 기본 개념

/* * http://sosal.kr/ * made by so_Sal */ 보건통계학 수업..수업때 블로깅하면서 듣는게 좋아서 두서없이 작성한 글. 기술 통계학(descriptive statistics)는 측정이나 실험에서 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성을 규명하는 통계적 방법이다.한 표본의 조사로부터 전체 집단의 현상을 추리하는 통계학. 확률론 따위의 방법을 쓴다. 그룹화된 데이터: 도수 분포Sturge's rule: 데이터가 N개일 때, histogram에서 breaks의 수를 k = 1 + 3.322 * log_10(N)로 하면 좋다. 라는 뜻.N이 만약 500이라면, 1+3.322 * log_10(500) = 1 + 3.322*2.69897 = 9.9659789.9..

Expectation–maximization과 R을 이용한 구현

/* * http://sosal.kr/ * made by so_Sal */ Expectation Maximization 알고리즘에 대해 어렴풋이 알고있었는데,이번기회에 R프로그래밍을 이용하여 직접 구현해보았다. 라이브러리를 사용하면 쉽게 사용할 수 있지만,수리통계와 확률론에 평소에 약했다고 느끼는 터라, 이번 기회에 한번 직접 구현해보았다.EM 알고리즘을 적용할 수 있는 예는 방대하지만, Clustering을 예제로 하여 이 글을 작성한다.Clustering의 대상은 DNA Sequence로 한다. 샘플: 데이터변수: 하나의 데이터(샘플)가 가지는 다양한 값 Clustering은 비슷한 변수를 가지고 있는 샘플들을 군집화 시켜주는 알고리즘이다. K-meansClustering 기법중, k-means cl..
