Protein Secondary Structure Prediction ((((단백질단백질...

18
생물정보학 강의 경상대학교 생화학과 생물정보학연구실 Bioinformatics Lab http://bio.gsnu.ac.kr Protein Secondary Structure Prediction Protein Secondary Structure Prediction Protein Secondary Structure Prediction Protein Secondary Structure Prediction ( ( (단백질 단백질 단백질 단백질 2 2 2차구조 차구조 차구조 차구조 예측 예측 예측 예측) ) ) Bioinformatics Lecture By Prof. Keun Woo Lee

Transcript of Protein Secondary Structure Prediction ((((단백질단백질...

Page 1: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Protein Secondary Structure PredictionProtein Secondary Structure PredictionProtein Secondary Structure PredictionProtein Secondary Structure Prediction

((((단백질단백질단백질단백질 2222차구조차구조차구조차구조 예측예측예측예측))))

Bioinformatics Lecture By Prof. Keun Woo Lee

Page 2: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

단백질구조의 필요성

Page 3: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Protein 2차구조 예측: Methods

Basic Procedure

A. 이미알려진 단백질의 구조와 정보 활용B. 물리-화학적 특성활용

• C-F (Chou-Fasman) Method : Q3=50~55%• GOR (Garnier-Osguthorpe-Robson) Method: Q3=~63% • Lim’s Method: Q3=~65%• Neural Network Method: Q3=~75%

Page 4: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Protein 2차구조예측: C-F Method

1978년 Chou와 Fasman에 의하여 제안됨.

Basic Procedure

Step1. 각 아미노산의 발생빈도 분석후 도표화. (도표이용)

Step2. 주어진 서열의 helix 와 sheet 가능성을 판별하고 양방향으로 확장.

Step3. 같은 위치에 두구조가능성이 겹칠경우 P(helix) 와 P(sheet) 의평균치를 비교하여 높은것으로 할당.

Step4. Turn의 경우 연속되는 4개의 아미노산을 중심으로 2단계 개별확률치로 수치화.

Page 5: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Protein 2차구조예측: C-F Method

Page 6: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Example: 다음과 같은 서열의 2차 구조를 예측하여라?

Step1. 도표를 이용하여 각2차구조의 가능성을 표시한다.

Protein 2차구조예측: C-F Method

Page 7: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

α-Helix 의 최소구성단위인 아미노산 6개 부터 시작

P(나선)이 100보다 큰지점에 멈추어 평균을 구한다.

이경우 3가지 서열이 가능하다.

C-F Method: Procedures

Page 8: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

최종 선정 부위: 노란색

Helix와 sheet이 둘다 가능한 경우:

Sheet으로 판정: P(sheet) > 105 and P(sheet) > P(helix)

Helix로 판정: 앞의 조건이 아닐때

C-F Method: Procedures

Page 9: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

C-F Method: Procedures

TurnTurnTurnTurn Structure Determination (턴 구조 결정)

Condition 1 : P(f4) > 0.75 X 10-4 ( P(f4)=f(i)f(i+1)f(i+2)f(i+3) )

Condition 2 : P(턴/Turn) > 100

Condition 3 : P(턴/Turn) > P(나선/Helix)

Condition 4 : P(턴/Turn) > P(평판/Sheet)

C-F / GOR Method program can be download athttp://fasta.bioch.virginia.edu/o_fasta/cgi

Page 10: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Protein 2차구조예측: GOR Method1978년 Garnier-Osguthorpe-Robson 이 개발

Page 11: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

GOR Method: Parameter Table

Page 12: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Protein 2차구조예측: 그외 방법들

-Lim’s Method (1974년): C-F나 GOR 같은 확률통계에 의존한 수치적 접근과는 달리아미노산 잔기의 물리화학적 특성에 기초한 2차구조 예측법.

-Sweet’s Method (1986)

-Nishikawa-Ooi Method (1986)

-Levin’s Method (1986)

-GGBCM Method (1988)

(강의페이지에 주어진 참고 논문 참조)

Page 13: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Protein 2차구조예측: Neural Network Method

Page 14: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

2차 구조 예측도, Q3

Q3 = 100 x ( NPred / NObs)

Page 15: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Hydropathy Analysis

1982년 Kyte-Doolitle 개발

Dividing amino acids by hydrophobicity/hydrophilicity

Page 16: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Hydropathy Analysis: Example

Is it a Trans Membrane Protein (TMP) ? Ex) Testing for a protein sequence from R. solanacearum

Threshold to be TMP:>2.0 with w=19

“Window를 19 (W=19)로 하여 색인지수 2를 넘는지역이 존재하면 강력한 알파나선이 존재하므로그 단백질은 TMP일 가능성이 매우 높다.”

Page 17: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Hydropathy Analysis: Example

Validation using secondary structure predictions:앞에서 Hydropathy Analysis법으로 예측한 결과대로 알파나선이 진짜 존재하는 지알아보기 위하여 그 부분 서열을 대상으로 2차구조예측법을 적용하여 보았다.

“Compatible with Hydropathy analysis result”

Page 18: Protein Secondary Structure Prediction ((((단백질단백질 …bio.gnu.ac.kr/lecture/bi/bi_prot_str/2DStrPred.pdf · 2005. 12. 5. · Protein Secondary Structure Prediction ((((단백질단백질

생물정보학 강의 경상대학교 생화학과 생물정보학연구실Bioinformatics Lab http://bio.gsnu.ac.kr

Trans Membrane Protein: Nin-Cin

Most TMPs show Nin-Cin condition(except for C. elegans).

“So number of α-helix should be even.”