Programing/R- programming 57

R - Cross-validation 평균 ROC 그리기

Split validation이나, Leave-One-Out Cross-validation (LOOCV) 를 하게 되면 적절하게 ROC curve를 그릴 수 있다. Split validation은 test set이 명확하게 있으니, 해당 샘플에 대해 ROC curve를 그리면 되고, LOOCV의 경우 데이터 하나당 Prediction 값을 저장해놓고 ROC curve를 그리면 된다. 그러면 Cross-validation은?? AUC 구하는거야, MRMC 기법이든 뭐든, 어쨌건 결과 값이 각 fold 별 AUC의 평균과 동일하기에 계산하면 되는데 ROC가 항상 문제이다. Multiple ROC curve에 대한 평균을 구하는 방식으로, Cross-validation의 mean ROC를 시각화 할 수 있는데..

Programing/R- programming 2022.10.02 (1)

몬티홀 딜레마, R 프로그래밍 솔루션

Suppose you’re on a game show, and you’re given the choice of three doors. Behind one door is a car, behind the others, goats. You pick a door, say #1, and the host, who knows what’s behind the doors, opens another door, say #3, which has a goat. He says to you, "Do you want to pick door #2?" Is it to your advantage to switch your choice of doors? 당신이 한 게임 쇼에 참여하여 세 문들 중 하나를 고를 기회를 가졌다고 생각해봐라. 한..

RMySQL: Can't connect to local MySQL server through socket '/tmp/mysql.sock' 에러

library(RMySQL) > dbConnect( MySQL() ) Error in .local(drv, ...) : Failed to connect to database: Error: Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2) > tmp/mysql.sock을 통해 MySQL로 접근할 수 없다고 에러가 뜬다. # Ubuntu $ cat /etc/lsb-release DISTRIB_ID=Ubuntu DISTRIB_RELEASE=18.04 DISTRIB_CODENAME=bionic DISTRIB_DESCRIPTION="Ubuntu 18.04.1 LTS" # MariaDB $ mysql --version mysql Ver..

Lasso, Ridge regularization - 회귀에서 selection과 shrinkage

Ridge regression과 Lasso regression은 선형회귀 기법에서 사용되는 Regularization이다. 그럼 Regularization은 무엇인가? 를 이해하기 위해, Bias와 Variance, 그리고 Overfitting부터 이해하도록 한다. 1. Bias vs Variance 1) Bias and Variance in Linear model Bias는 학습된 모델이 Training data에 대해 만들어낸 예측값과, Training data값과의 Error를 말한다.Variance는 학습된 모델이 Test data에 대한 예측값과, 정답과의 Error를 말한다. 따라서 위와같이 선형함수의 경우, Training data를 완벽하게 맞추지 못하며 Bias가 어느정도 있다는 것을 알..

Programing/R- programming 2019.01.18 (1)

R system command 127 에러

> for(i in 1:length(commands)) system(commands[i])50건 이상의 경고들을 발견되었습니다 (이들 중 처음 50건을 확인하기 위해서는 warnings()를 이용하시길 바랍니다).> > warnings()경고 메시지:1: 명령 'move ISIC_0024310.jpg ../'의 실행으로 상태 127가 되었습니다2: 명령 'move ISIC_0024315.jpg ../'의 실행으로 상태 127가 되었습니다..... 이거 왜이러나 했더니,command에 "cmd.exe /c" 를 앞쪽에 넣어줘야함. movefiles

Programing/R- programming 2018.10.23 (2)

R deep learning with Keras

/* * http://sosal.kr/ * made by so_Sal */ Data 분석은 주로 R,딥러닝 모델 구현은 Python을 이용했었다. 파이썬은 General 한 프로그램을 구현하기엔 좋지만,데이터를 분석하기에는 불편한 점이 굉장히 많다. 데이터 분석 중간 중간마다 어떤 process를 거쳤을 때, 중간 분석 과정에서 결과가 어떻게 나오는지 상세히 확인해줄 필요가 많은데Python은 실시간으로 데이터의 특징을 파악하기엔 불편한 점이 너무 많다.특히 Visualization도 굉장히 불편하고.. (물론 불가능한 건 아니지만, 개인적으로 시간과 노력이 R에 비해서 5배 이상은 더 드는 것 같다.) 그런데 이제는 딥러닝도 R로 구현이 가능해졌다 !!KERAS 덕분에.. GPU와 연동때문에, 딥러닝은..