K2D2:추정 단백질의 보조 구조에서 원형 이색 스펙트럼
CD 스펙트럼과 데이터 구조
의 숫자 43CD 에서 스펙트럼 단백질로부터 얻은 CDPRO 참조 설정 CDDATA.43 다른 참여자로부터 건설(W.C. 존슨과). 그것은 구성 스펙트럼을 위해 수용성 단백질과의 다양한 보조 구조를 구성:주로 알파(적혈구,헤모글로빈,hemerythrin,etc.),주로 베타(엘라 스타 제,종양 괴사 인자,알파-키모 트립신 등)및 알파/베타(트리 오스 포스페이트 이소 머라 제,락 테이트 탈수소 효소,리소자임,서모 리신 등)(표 1 참조). 우리의 시도를 사용하여 더 큰 CD 데이터 세트를 포함하는 13transmembrane 단백질 결과에서는 가난한 성능의 방법을 제안하는 이러한 단백질이 필요한 전문화된 방법만 훈련을 가진 transmembrane proteins. 구형 단백질로 훈련 된 CD 방법으로 막 횡단 단백질의 2 차 구조를 예측하는 데 어려움이 이전에 지적되었습니다.
우리가 선택 최고의 해상도 차 구조에 해당하는 단백질 기준 설정 단백질에서 데이터 은행(PDB). 우리는 참조 세트의 모든 단백질의 개별 아미노산에 2 차 구조 클래스를 할당하기 위해 PDB 파일에 DSSP 프로그램을 사용했습니다. 우리는 할당 알파-나선하는 단백질의 잔류물 레이블이 붙으로서 베타-스트랜드 이러블 전자와 다음의 계산수은 아미노산의에서는 단백질이에서 각 구조(표 1 참조). CDDATA 이외에.43 스펙트럼,우리는 교육에 포함되어 있 설정은 여섯 명의 스펙트럼 참조에서:세 가지 스펙트럼의 폴리(L-lysine)수용액에서 알파,베타 무작위 conformations,그리고 세 가지 모델은 스펙트럼에서 알파,베타 임의의 형태에서 건설 15 단백질이다.
스펙트럼 SOM 및 2 차 구조 맵
18×18 뉴런의지도를 som_pak 패키지를 사용하여 49CD 스펙트럼으로 훈련시켰다. 맵의 크기와 부드러운지도를 생성 훈련 매개 변수에 작은 변화는 성능에 큰 차이를 생성하지 않았다. 최종지도는 무작위로 시작된 100 개의 맵을 평균하여 생성되었습니다. 한 번은 스펙트럼 SOM 얻은 우리가 생성하는 두 개의”보조 구조 맵”,하나는 알파-나선과 다른 베타-드도 있습니다. 우리는 18×18 노드(SOM 과 같은 크기)의 그리드로 시작하여 훈련 세트의 각 스펙트럼을 SOM 의 뉴런과 관련된 가중치 벡터와 비교합니다. 어 스펙트럼,우리는 그”가까이”신경에서 SOM 지도,그리고 우리는 할당수의 보조 구조의 해당하는 단백질을 동(동일한 좌표)에서 노드는 그리드. 에서 생산하기 위해 매끄러운지도(그림 1 참조),대만 고려하고 가까운 신경에서는 스펙트럼 SOM 우리는 계정으로 수 n 의 가장 가까운 신경세포종의 가치 보조 구조 분수가 선형 값의 조합의 각 신경에 의해 무게가 역이 그들의 거리가 있습니다. 6 개 이상의 이웃 뉴런을 포함 시키면 최상의 결과를 얻을 수있었습니다. 더 나은 성능을 얻은 경우에는 추가로 여섯 스펙트럼 참조로서 포함되지 않은 계산에 보조 구조를 지도 있지만,성능이 감소하는 경우 우리는 제거뿐만 아니라 그들을 훈련에서 설정의 스펙트럼 SOM. 그러므로 우리는 훈련을 위해 그들을 지켰습니다.

K2D2 웹 서버를 입력 및 출력됩니다. (A)입력 스펙트럼을위한 창. (B)입력 및 예측 스펙트럼의 비교.
예상 최대 오류가
원칙적으로,더 많은 유사한 특정 스펙트럼을 가장 가까운 SOM 스펙트럼 노드,더 나은 것이다. 에서 다른 말로 하면,스펙트럼이 매우 다르게 아무것도의 방법은”이전에 보”(로 설정)결과할 수 없습 될 것으로 예상된 아주 정확합니다. 사용자에게 제공하의 견적을 최대 총 오류의 예측(으로 합계에 대한 오류는 알파와 베타 예측)우리가 사용하는 거리에 가장 가까운 노드를 지도와 해당하는 관찰되는 총에서 오류를 벤치마크입니다. 주어진 거리에서 최대 오차는 벤치 마크에서 관찰 된 가장 큰 총 오차입니다. 따라서,예측에 대한 총 오차는 추정 된 최대 오차보다 작을 것으로 예상된다. 거리가 벤치 마크에서 관찰 된 것보다 크면 최대 오차의 추정이 불가능하다는 메시지가 표시됩니다; 이 상황에서 구조 예측을 고려해서는 안됩니다.
웹 서버
K2D2 는 K2D2 사이트에서 액세스 할 수 있습니다. 사용자가를 선택해야 합 입력 파장 범위(200-240nm 또는 190-240nm)에서 제공하는 스펙트럼의 문제는 단백질(그림을 참조하십시오 1A). 스펙트럼은 Δε 단위 여야합니다. 로 결과에 대한 더 나은 190-240nm wavelength range,이 옵션을 사용하는 것이 좋습니다 경우에는 사용자를 공급할 수 있 스펙트럼에는 이 범위가 있지만 우리는 짧은 범위의 입력으로 그것은 때로는 어렵다. 결과로 구성의 예상 값에 대한 비율의 잔류물에 알파선,베타-스트랜드,추정된 오류에 대한 예측과 그래픽을 비교하고 예측했 스펙트럼과 함께 사용자는 입력한다(그림 1B). 플롯은 예측의 정확성에 대한 시각적 평가를 제공합니다.