본문 바로가기

Biology

트립신 유사 단백질의 구조와 기능의 관계, Structure-Function Relationship of Trypsin-like Proteins

 이번 글은 과제를 하면서 알게 된 것을 정리하고자 한다. 트립신Trypsin, 키모트립신Chymotrypsin, Enteropeptidase, Epithin, Matripatase2 의 5가지 단백질을 사람과 쥐에 대해서 비교하고자 한다. 이 다섯개의 단백질은 모두 단백질을 가수분해하는 도메인domain을 가지고 있다. 


[그림 1. 오른쪽은 사람, 왼쪽은 쥐의 단백질을 표시했다. 위에서부터 차례대로 Trypsin, Chymotrypsin, Enteropeptidase, Epithin, Matripatase2 이다. 각 단백질의 길이와 도메인의 위치는 Uniport를 참조하여 그렸다. 클릭하면 더 크게 볼 수 있다.]


사람과 쥐의 단백질은 왼쪽과 오른쪽을 비교해봤을 때 큰 차이점이 없다는걸 알 수 있다. 게다가 Epithin과 Matripatase2는 비슷한 도메인들을 가지고 있다. Trypsin과 chymotrypsin은 단백질을 분해하는 소화 효소이고, enteropeptidase는 십이지장의 세포에서 분비되는 효소이다. Enteropeptidase는 효소로서 활성이 없는 trypsinogen을 분해하여 trypsin으로 만들어준다. Epithin과 Matripatase2는 둘다 세포막 단백질membrane protein으로 유방암의 전이에 관련된 단백질이다. 사실, epithin은 여러 이름이 있는데 matriptase1, suppressor of tumorigenicity 14 protein 등이 있다. Epithin의 다른 이름인 matriptase1 을 보아서 matripatase2와 상당한 연관이 있음을 알 수 있고, suppressor of tumorigenicity 14 protein를 통해 종양tumor과 큰 연관이 있음을 짐작할 수 있다.


그리고 enteropeptidase 와 epithin, matripatase2은 모두 SEA 도메인과 CUB 도메인, LDL-R 을 가지고 있다. 


서로 다른 종의 서로 다른 단백질들이 같은 도메인을 가지는 것을 통해 단백질 단위의 진화론을 생각해보자. 10개의 단백질들은 서로 완전히 개별적으로 같은 도메인을 가지게 되는 진화보다 한 개의 도메인이 완성된 후 유전자가 도메인 단위로 섞이면서 같은 도메인을 가진 단백질들이 생기는 진화가 더 납득하기가 쉽다.


 

 하지만 열개의 단백질 모두 peptidase S1 domain을 가지고 있다. Peptidase S1 도메인은 다른 이름으로 serine protease라고 한다. Serine protease라고 하는 이유는 먼저 단백질 분해효소protease 기능이 있고 나중에 보겠지만 serine이 이 도메인에서 중요한 역할을 하기 때문이다.


Peptidase S1의 아미노산 서열 중에서 시스테인cysteine이 있는 곳은 이황화 결합disulfide bond을 하게 된다. 


[그림 2. 위는 쥐의 trypsin과 아래는 사람의 epithin이다. 각각의 이황화 결합disulfide bond를 위치와 함께 표시했다.]


서로 다른 종의 다른 단백질에 있는 Peptidase S1 도메인이다. 이 중 세 개의 이황화 결합이 같은 위치에 있는 것, 즉 이황화결합이 보존되어 있는 것을 볼 수 있다. 



[그림 3. 열개의 단백질 서열을 정렬alignment 한 것이다. 전부 같은 아미노산이 오면 위에 ★, Isoleucine 과 leucine 과 같이 비슷한 아미노산이 전부 있으면 :, 같거나 비슷한 아미노산이 80% 이상 있으면 . 으로 표시된다. 또 전체적인 서열을 일치시키키 위해 빈 곳이 생기는데, -으로 표시된다.]


10개의 단백질을 정렬해보면 위와 같이 된다. 몇가지 ★과 : 가 연속하는 부분이 있는 것을 관찰할 수 있다. 처음 4개의 서열은 IVGG로 이 부분부터 trypsin domain이 시작된다. 39번~46번 아미노산 서열은 WLVSAAHC인데 이 부분은 효소의 active site를 구성하며 이 중 히스티딘histidine은 반응에 직접 관여한다. 100~104번 아미노산 서열 DIALL의 아스파르산aspartic acid과 192~199번 아미노산 서열 CQGDSGG의 세린serine도 역시 active site에서 반응에 직접 관여하는 아미노산이다. 그 외의 보존된 서열, consensus sequence는 다양한 부분에서 찾을 수 있는데 이는 이 단백질의 구조를 결정하는데 중요한 부분일 것이다.


사람의 트립신Trypsin과 키모트립신chymotrypsin을 비롯한 구조를 보자. 


[그림 4. 왼쪽부터Trypsin, Chymotrypsin, Enteropeptidase, Epithin, Matripatase2 이다. 

단백질의 구조는 pyMOL로 구현했으며, 괄호 안의 번호는 PDB 번호이다.]


 5개의 peptidase S1 domine 모두 구조가 유사한 것을 볼 수 있다. 비슷한 구조를 가짐으로써 비슷한 기능을 수행할 수 있는 것을 알 수 있다. 

[ Trypsin, Chymotrypsin, Enteropeptidase, Epithin, Matripatase2 순으로 겹치게 그렸다. 각각 파란색, 노란색, 하늘색, 주황색, 초록색이다.]

 비교를 보다 정확히 하기 위해서 이들을 겹치게superimpose 만들었다. 5개의 peptidase S1 domain 모두 구조가 유사함을 확인할 수 있다. 트립신은 아르지닌arginine과 리신lysine 옆을 끊지만 키모트립신Chymotrypsin은 소수성 아미노산hydrophobic amino acid옆을 끊는다. 즉 촉매 반응을 하는 부분은 같아서 같은 기능을 가지지만, 그 외의 부분이 다르기 때문에 선호하는 아미노산이 다른 것이다. 



[그림 6. 왼쪽부터Trypsin, Chymotrypsin이다. ]


보라색으로 표현된 부분은 단백질을 가수 분해하는 세 아미노산 His45, Asp100, Ser197 이다. 이 세 아미노산은 사람과 쥐의 단백질 10개 모두 공통된 부분이다. 그러면 가수분해할때 선택하는 아미노산이 다른 이유는 빨간색과 녹색으로 표현한 고리loop의 서열이 다르기 때문이다. 먼저 trypsin의 서열은 GYLEGGKD, AQKNKP 이다.Chymotrypsin은 GASVS, CSTSTP이다.  Trypsin에는 글루탐산Glutamic acid을 포함하여 음전하를 띠는 아미노산이 있다. 그에 반해 trypsin은 발린valine을 포함해 소수성 아미노산이 있다. 더 정확히 알아보기 위해서 이 두 단백질의 표면 전하를 살펴보자.



[그림 6. 왼쪽부터Trypsin, Chymotrypsin이다. 

빨간색은 음전하, 파란색은 양전하, 흰색은 전하가 없다는 것을 뜻한다.]


 두 고리loop가 이루는 부분이 trypsin은 음전하로, chymotrypsin은 전하가 없음을 확인할 수 있다. 이를 통해 Trypsin은 양전하를 띠는 lysine과 arginine을 선호하며 chymotrypsin은 소수성 아미노산을 선호한다는 것을 설명할 수 있다. 다른 Peptidase S1 domain을 갖는 단백질들을 확인하자.


[그림 7. 왼쪽부터 enteropeptidase, epithin, matriptase 2이다. 

빨간색은 음전하, 파란색은 양전하, 흰색은 전하가 없다는 것을 뜻한다.]


 이 세 개의 domain들은 대체로 빨간색을 띄는 것을 확인할 수 있고, enteropeptidase는 lysine을, epithin은 lysine과 arginine을, matriptase 2도 lysine과 arginine을 선호한다. 


 이 loop가 형성한 구멍을 통해 어떻게 아미노산을 인식하는지 아래 그림을 통해 알아보자.


[그림 8. Trypsin과 substrate가 결합한 모습이다. 

빨간색은 음전하, 파란색은 양전하, 흰색은 전하가 없다는 것을 뜻한다.]


 오른쪽 그림을 보면 양전하를 띠는 lysine이 loop안의 구멍에 들어간 것을 알 수 있다. 이렇게 각 peptidase S1 domain은 이 구멍을 통해서 자신의 substrate를 구별하는 것이라 생각한다. 


 이를 통해 아미노산 서열이 트립신과 키모트립신의 구조를 결정하는 것을 알 수 있었다. 또한 구조가 결정되면 단백질의 기능 또한 결정된다는 것을 알 수 있다.