Blog

씨더스 블로그 자료를 공유합니다.

씨더스 블로그

Fold change, P-value, FDR

페이지 정보

작성자 최성진 작성일14-05-13 11:21 조회5,684회 댓글0건

본문

 

이미지 3.jpg
 
Fold change
: 쉽게 말해서, control에 비해 발현이 2배 확인된다는 이야기다
 
control이 30인데, 반응 후(시약 처리 등) 60이 되었다면 2 fold change
control이 30인데, 반응 후(시약 처리 등) 120이 되었다면 4 fold change
 
위에 언급한 논문과 같이, p-value와 여러가지를 고려 했을때 2 fold change정도에서 유의할만한 결과가 예상되고,
갯수가 너무 많을 경우에는 3 folding, 4 folding으로 늘려야 겠지만
10에서 30, 40 되는 것은 쉽지만, 10,000에서 반응이 20,000 (2 folding)도 어려운데 30,000, 40,000은 더 어려운 이야기가 되므로 잘 고려해야 한다.
 
 
 
 
 
 
이미지 7.jpg
 
 
p-value
귀무가설이 참임에도 불구하고 기각될 확률
검정통계값이 1종오류를 범할 확률
수집한 검정통계량의 값보다 더 확실하게 귀모가설을 기각할 검정 통계량의 값을 얻을 확률
 
뭐, 말이야 이런데
쉽게 생각하자.
 
내 데이터 내 가설이 얼마나 유의성 있는, 남들에게 어필할 수 있는 값을 가질 수 있느냐다
0.05면 100에 5의 오류를 허용하겠다는 (귀무가설이 참임에도 불구하고 내 가설을 채택할 오류의 수준을 100개중 5개정도는 눈감아 주겠다) 이야기다.
 
그러니,
p-value값이 내려갈 수록 더 신뢰할 수 있는 결과라고 이야기 할 수 있다.
 
통상적으로 p<0.05 (*)로 표시하고 많이 쓰며, p<0.01(**), p<0.001(***)의 수준을 사용한다.
 
 
 
 

 

이미지 4.jpg
 
"DEG 선발 시 FDR 0.01이하"의 의미는 control과 treatment에서 유전자의 발현량이 실제로는 2 fold change 이상 차이가 나지 않음(=DEG가 아님)에도 불구하고 통계분석 결과 차이가 나는 것으로 잘못 판단 내릴 확률 1% 이하임을 의미한다.

FDR(False Dicovery Rate) = false positive / total positive (total positive = false positive + true positive)
통계 분석 시 발생하는 오류를 개선하기 위해 사용되는 방식으로, FDR은 유의하다고 판단한 것 중에 실제로는 유의하지 않은 것의 비율이다. 이 비율을 0.05로 고정한다면, 유의하다고 판단했을 때 틀릴 확률은 0.05로 고정할 수 있다. 
 
[출처: http://3months.tistory.com/262, http://www.incodom.kr/Multiple_test_adjustment]
[참고자료 : http://blog.daum.net/bhumsuk/4858532]
 
 
 
 

 

이미지 5.jpg
 
 
말은 어려운데 간단하다.
 
내가 어떤 현상을 봤을때, 혹은 주장하고 싶은 것이 대립가설이고
그것을 증명하기 위해 반대쪽에 세워 (이런저런 증거로 기각하려고 하는) 두는 가설이 귀무가설(영가설)이다.
 
따라서, 귀무가설은 기각되길 원하는 가설이라고도 표현을 한다.
 
 
 
 
 

 

이미지 6.jpg
 
 
위의 슬라이드와 같이 귀무가설(H0)이 참인데, 귀무가설을 채택하면 옳은 결정.
하지만, 귀무가설이 참임에도 불구하고 대립가설(H1)을 채택을 하면 1종 오류, a오류가 된다.
 
반대로, 대립가설이 참임에도 불구하고 귀무가설을 채택하면 2종 오류, b오류가 된다.
 
사형수 이론을 많이 접목시켜 설명을 하는데,
죄가 없음에도 불구하고, 유죄 판결을 내어 사형에 이르게 하는 것이 1종오류
죄가 있음에도 불구하고 무죄 판결을 내어 풀어주는 것이 2종오류
 
2종오류보다, 1종오류가 더 심각하게 판단해야 되는 이유다.
 
 
 
 

댓글목록

등록된 댓글이 없습니다.