전체 글 782

tf.Keras 기본코드로 이해하는 Transformer

뭔가 Transformer는 참 항상 어렵게 느껴졌었다. 왜이렇게 강의들이나 문헌들이 어렵게 적혀있는지, Key, Query, Value는 도대체 어디서 튀어나오는 것인지 명확하게 이해가 안됐다. 내가 이해할 수 있도록 글을 쓰면, 독자분들도 쉽게 이해할 수 있지 않을까? 라는 마음으로 이 글을 한번 써보도록 한다. 코드는 모델링을 기준으로 상세하게 덧붙여 가며 설명한다. 0. Library & 예제 데이터 준비 - Tensorflow Keras, Library Load import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers from tensorflow.keras.models import Sequent..

GTEx에서 Pathology image 분석하기

Normal H&E Slide image를 분석할 일이 생겨서, 분석을 해본 겸, 정리 포스트를 남겨놓으려고 한다. 1. GTEx phenotype 데이터 활용하기 개인적으로 TCGA, ICGC, GTEx 등 유전체 데이터를 활용할 때, UCSC Xena를 자주 활용한다. 서로 다른 데이터베이스의 batch effect 등을 정리한 데이터까지 제공해서.. 무척 편하다. https://xenabrowser.net/datapages/?cohort=GTEX&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443 phenotype - GTEX phenotype (n=9,783) UCSC Toil RNA-seq Recompute GTEx 데이터에서 원하는 tissue..

LUAD의 Lymph meta를 Radiomics, Deep Learning으로 비교

https://link.springer.com/article/10.1007/s00330-022-09153-z Ma, Xiaoling, et al. "Development and validation of a deep learning signature for predicting lymph node metastasis in lung adenocarcinoma: comparison with radiomics signature and clinical-semantic model." European Radiology (2022): 1-14. Lung adenocarcinoma (LUAD) 에서, Lymph node metastasis를 예측하는 논문인데,Deep learning과 Radiomics 두가지 모델을 구성..

R - Cross-validation 평균 ROC 그리기

Split validation이나, Leave-One-Out Cross-validation (LOOCV) 를 하게 되면 적절하게 ROC curve를 그릴 수 있다. Split validation은 test set이 명확하게 있으니, 해당 샘플에 대해 ROC curve를 그리면 되고, LOOCV의 경우 데이터 하나당 Prediction 값을 저장해놓고 ROC curve를 그리면 된다. 그러면 Cross-validation은?? AUC 구하는거야, MRMC 기법이든 뭐든, 어쨌건 결과 값이 각 fold 별 AUC의 평균과 동일하기에 계산하면 되는데 ROC가 항상 문제이다. Multiple ROC curve에 대한 평균을 구하는 방식으로, Cross-validation의 mean ROC를 시각화 할 수 있는데..

윈도우11 자판배열 ENG (영어)미국 US 없애는법

가끔, 자기 멋대로 '자판 배열' 이 영어(미국) US 로 바껴서, 한영 전환이 안될 때 가 있다. 이녀석을 제거해보자. 1. 시작키를 누른 후, "언어 설정" 을 검색, 그리고 실행한다. 2. 언어 목록에는 '한국어' 밖에 없고, 영어(미국)은 보이지도 않는다. 이게 윈도우 11 키보드 자판 버그인데, 동일한 언어를 추가 후 삭제하는 것이 해결책이다. '언어 추가' 버튼을 누른다. 3. english 를 검색하고, English (United States) 영어(미국) 을 선택 후, '다음' 을 누른다. 4. 모든 체크박스를 해제하고, 언어를 설치한다. 5. 설치가 완료 되면, 이제 삭제한다. 6. 깔끔해진 자판 배열 수고하셨습니다.

Windows_ 2022.10.02

Multi-class와 Multi-label classificiation, 분포가 다른 Output들

딥러닝 연구를 하다보니, 다양한 task를 수행하게 된다. 그 중, 딥러닝을 자주 씀에도 불구하고 내게 조금 헷갈렸던 task가 있는데, 바로 Multi-class와 Multi-label 이다. 쉽고 기본적인 내용같지만, Label의 형태에 따라서 매우 복잡한 문제가 될 수도 있다. 이 글에서는 Multi-label을 예측하는 문제에서, Output이 어떤 것은 Regression을 해야하고, 어떤 것은 classification을 수행해야 할 때를 위해 내가 정리하는 글이다. 1. Bianry classification - Sigmoid 일단 binary classification은, Logistic regression과 동일한 task로 간단한 sigmoid로 쉽게 해결할 수 있다. Sigmoid는 ..

deep learning for the life sciences

요즘, 책을 사기만 하고 리뷰를 통 못했는데, 2년 전에 나온, 그것도 번역서지만 이런 책을 왜 이제서야 발견했을까? 놀라움에 얼른 집어 구매하고, 카페에 와서 간단하게 인덱스, 내용들을 리뷰해봤다. http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791161754420&orderClick=LAG&Kc= 생명과학을 위한 딥러닝 - 교보문고 생물학, 유전체학, 신약 개발에 적용하는 실무 딥러닝 | 로봇 공학의 발전으로 수많은 생명과학 실험들은 자동화돼 엄청난 양의 데이터를 만들어 낸다. 현대 생명 과학자들은 거대한 데이터 속 www.kyobobook.co.kr 인덱스는 다음과 같다. 1장. 왜 생명과학인가?..

뱀파이어 서바이벌, 렉 안걸리게 하는법

노트북으로 뱀파이어 서바이벌 하다보면, 극후반에 몬스터 몰려올 때 엄청 느려지죠? 렉 엄청 심한거, 노트북에서도 안걸리게 하는 법 있습니다. 1. 게임 중에 ESC를 누른다. 2. Options에 들어간다. 3. 옵션 셋다 X로 바꾼다. - Flashing VFX - Visible Joystick - Damage Numbers 셋다 X로 바꾸면 노트북에서도 랙 없이 게임 가능합니다. 즐겜하세용

NIW 미국 영주권 petition 승인 후기

박사과정, 그리고 산업계에서 병특 중에 NIW를 통해 미국 영주권을 얻게 되었습니다. 지원 시기, 그리고 어떤 과정을 거쳤는지, 그리고 기다리는 기간 동안 조사해볼 수 있는 여러가지 정보에 대해 공유해보고자 합니다. 일기 처럼 적는 터라, 말을 조금 편하게 적었습니다. 0. NIW에 관심을 갖게 된 계기 요즘 Bio+Medicine+Informatics 분야가 확 떠서, 국내 산업계에서도 페이가 상당히 좋다. 어릴 적, 연봉 1억이라고 하면 대단해 보였는데 막상 세금 떼고 나면 월급이 600 조금 넘게 들어온 다는 사실과, '저 아파트에 살고싶다' 꿈꿔왔던 집값이 3배가 되는 걸 보고는 좌절.. 그럼 살아남을 방법은 무엇인가? 생각해보니 미국의 연봉이었다. https://www.levels.fyi/ Le..

Stigmatized./Essay 2022.02.26