Major Study. 148

GTEx에서 Pathology image 분석하기

Normal H&E Slide image를 분석할 일이 생겨서, 분석을 해본 겸, 정리 포스트를 남겨놓으려고 한다. 1. GTEx phenotype 데이터 활용하기 개인적으로 TCGA, ICGC, GTEx 등 유전체 데이터를 활용할 때, UCSC Xena를 자주 활용한다. 서로 다른 데이터베이스의 batch effect 등을 정리한 데이터까지 제공해서.. 무척 편하다. https://xenabrowser.net/datapages/?cohort=GTEX&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443 phenotype - GTEX phenotype (n=9,783) UCSC Toil RNA-seq Recompute GTEx 데이터에서 원하는 tissue..

LUAD의 Lymph meta를 Radiomics, Deep Learning으로 비교

https://link.springer.com/article/10.1007/s00330-022-09153-z Ma, Xiaoling, et al. "Development and validation of a deep learning signature for predicting lymph node metastasis in lung adenocarcinoma: comparison with radiomics signature and clinical-semantic model." European Radiology (2022): 1-14. Lung adenocarcinoma (LUAD) 에서, Lymph node metastasis를 예측하는 논문인데,Deep learning과 Radiomics 두가지 모델을 구성..

Multi-class와 Multi-label classificiation, 분포가 다른 Output들

딥러닝 연구를 하다보니, 다양한 task를 수행하게 된다. 그 중, 딥러닝을 자주 씀에도 불구하고 내게 조금 헷갈렸던 task가 있는데, 바로 Multi-class와 Multi-label 이다. 쉽고 기본적인 내용같지만, Label의 형태에 따라서 매우 복잡한 문제가 될 수도 있다. 이 글에서는 Multi-label을 예측하는 문제에서, Output이 어떤 것은 Regression을 해야하고, 어떤 것은 classification을 수행해야 할 때를 위해 내가 정리하는 글이다. 1. Bianry classification - Sigmoid 일단 binary classification은, Logistic regression과 동일한 task로 간단한 sigmoid로 쉽게 해결할 수 있다. Sigmoid는 ..

deep learning for the life sciences

요즘, 책을 사기만 하고 리뷰를 통 못했는데, 2년 전에 나온, 그것도 번역서지만 이런 책을 왜 이제서야 발견했을까? 놀라움에 얼른 집어 구매하고, 카페에 와서 간단하게 인덱스, 내용들을 리뷰해봤다. http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791161754420&orderClick=LAG&Kc= 생명과학을 위한 딥러닝 - 교보문고 생물학, 유전체학, 신약 개발에 적용하는 실무 딥러닝 | 로봇 공학의 발전으로 수많은 생명과학 실험들은 자동화돼 엄청난 양의 데이터를 만들어 낸다. 현대 생명 과학자들은 거대한 데이터 속 www.kyobobook.co.kr 인덱스는 다음과 같다. 1장. 왜 생명과학인가?..

오토마우스 무한클릭 v1.7 - Auto Click

/* * http://sosal.kr/ * made by so_Sal */ 마우스를 자동으로 클릭해주고, 키보드를 자동으로 입력하게 하는 오토마우스 무한클릭입니다. 무한클릭 프로그램은 관리자 권한을 일체 요청하지 않는 안전한 프로그램입니다. 게임이나 반복적인 업무를 하실 때 유용한 프로그램입니다. - 오토마우스 무한클릭 다운로드 비밀번호: sosal 오토마우스 무한클릭의 인터페이스는 다음과 같습니다. 1. 오토마우스 실행 / 종료 Start에 해당되는 F5 버튼을 클릭하면 오토마우스 기능이 시작되며 Stop에 해당되는 F6 버튼을 클릭하면 오토마우스의 기능이 중지됩니다. 2. 오토마우스 실행버튼, 종료버튼 변경 F5 버튼의 스크롤을 클릭하시면 다른 버튼으로 수정할 수 있습니다. 3. 자동으로 입력할 이벤..

Bioinformatics 공부용 웹사이트 rosalind.info

최근 거의 3년간? 거의 메디컬 연구, paper writing에만 집중하다보니, bioinformatics 분야와 코딩실력에 자신감이 무척이나 떨어졌다. 그런데, bioinformatics 분야에서 ACM ICPC 문제 (국내에서 백준? 같은?) 푸는 비슷한 사이트가 있어, 공부용으로 참 좋겠다 싶어서 시작해봤다. 5문제 정도 풀어봤는데, 아직은 너무 쉬워서 잘 모르겠지만, 뒤로 갈수록 기대가 된다 ㅎㅎ

AI in health care - National Academy of Medicine 리뷰 pdf

Index는 다음과 같습니다. ARTIFICIAL INTELLIGENCE IN HEALTH CARE: THE HOPE, THE HYPE, THE PROMISE, THE PERIL OVERVIEW OF CURRENT ARTIFICIAL INTELLIGENCE HOW ARTIFICIAL INTELLIGENCE IS CHANGING HEALTH AND HEALTH CARE POTENTIAL TRADE-OFFS AND UNINTENDED CONSEQUENCES OF AI AI MODEL DEVELOPMENT AND VALIDATION DEPLOYING AI IN CLINICAL SETTINGS HEALTH CARE AI: LAW, REGULATION, AND POLICY ARTIFICIAL INTELLIGENC..

Differential privacy - 차등 개인정보 보호

의학 연구에 있어서, 샘플의 정보는 환자 개인의 고유한 정보라고 할 수 있다. 따라서 개인의 자발적 동의 없이 데이터를 유통하는 것은 쉽지 않다. 분석가치가 높은 데이터일수록, 혹은 Sample에 대한 정보가 많을수록 정보의 민감성은 증가한다. 따라서 데이터를 활용하기 위해선 개인정보를 보호하는 단계는 필수적이다. 1. Definition of Attributes in Data Privacy 1) Identifiers: 식별자 (혹은 Key) 흔히 Database에서, entity (개체)를 구분할 수 있는 변수를 Key라고 부른다. 식별자는 의료데이터에서 각 샘플들을 독립적으로 구분할 수 있는 변수기 때문에, 필히 민감정보가 된다. 예를 들어 주민번호, 전화번호, 환자등록번호, 계좌번호, 영상의학이미지..

gsutil - google cloud platform 리눅스 사용법

gsutil은 google sotrage를 다루기 위한 툴인데,GnomAD, 1000 genome 등등 공개 빅데이터를 다운받으려면 gsutil 이라는 툴을 사용해야 하는 경우가 많다. 프로그램에 대한 자세한 설명은 안나와있지만, 다운로드 속도가 빠른걸 보니아마 UDP 기반으로 만들어진 파일전송 시스템이 아닐까 싶다. ;; [sosal@cipher reference]$ uname -aLinux cipher.snubi.org 2.6.32-642.4.2.el6.x86_64 #1 SMP Tue Aug 23 19:58:13 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux 리눅스에서 uname -a라고 치면, 64비트인지 32비트인지 알 수 있다.x86_64 이기 때문에, 64비트이며 아래..