K2D2: a fehérje másodlagos szerkezetének becslése a kör alakú dikroizmus spektrum alapján
CD spektrum és szerkezeti adatok
a fehérjékből származó 43 CD spektrum a CDPRO referenciakészlet CDDATA-ból származik.43 épített különböző közreműködők (W. C. Johnson és ). Spectra-ból áll az oldható fehérjék számára, amelyek különböző másodlagos szerkezetű összetételűek: főleg alfa (mioglobin, hemoglobin, hemeritrin stb.), elsősorban béta (elasztáz, tumor nekrózis faktor, alfa-kimotripszin stb.) és alfa / béta (trióz-foszfát-izomeráz, laktát-dehidrogenáz, lizozim, termolizin stb.) (lásd 1. táblázat). A kísérlet, hogy egy nagyobb CD adathalmaz, amely magában foglalja a 13 transzmembrán fehérjék eredményezett rosszabb teljesítményt a módszer, ami arra utal, hogy ezek a fehérjék igényelnek speciális módszer képzett csak transzmembrán fehérjék. Korábban megfigyelték a transzmembrán fehérjék másodlagos szerkezetének előrejelzésének nehézségeit a globuláris fehérjékkel képzett CD-módszerekkel .
a Protein Data Bank (PDB) referenciakészletében szereplő fehérjéknek megfelelő legjobb felbontású tercier struktúrákat választottuk ki . A DSSP programot a PDB fájlokon használtuk annak érdekében, hogy másodlagos struktúraosztályt rendeljünk az egyes aminosavakhoz a referenciakészlet minden fehérjéjében. Az alfa-hélixet a H és béta-szál címkével ellátott fehérjemaradványokhoz rendeltük az E címkével rendelkezőkhöz, majd kiszámítottuk az aminosavak frakcióját a fehérjében minden konformációban (lásd az 1.táblázatot). Amellett, hogy a CDDATA.43 spectra, mi szerepel a képzési készlet hat további referencia spektrumok: három spektruma poli (L-lizin) vizes oldatban alfa, béta és véletlen konformációk, és három modell spektrumok alfa, béta és véletlen konformáció épített 15 fehérjék .
Spectra SOM és secondary structure maps
a som_pak csomag segítségével 18 × 18 neuronból álló térképet képeztek ki a 49 CD-spektrummal . A sima térképeket előállító térképméretek és képzési paraméterek kis eltérései nem okoztak nagy különbségeket a teljesítményben. A végleges térképet 100 véletlenszerűen elindított térkép átlagolásával állították elő. A spectra SOM megszerzése után két “másodlagos szerkezeti térképet” készítünk, az egyik az alfa-helixhez, a másik a béta-szálhoz. 18 × 18 csomópontos (A SOM méretével megegyező méretű) rácsokkal kezdjük, és összehasonlítjuk a képzési készlet minden spektrumát a Som neuronjaihoz kapcsolódó súlyvektorokkal. A spektrumot tekintve a Som térképen megtaláljuk a “közelebb” neuront, és a megfelelő fehérje másodlagos szerkezetének töredékét hozzárendeljük a rács ekvivalens (azonos koordináták) csomópontjához. Annak érdekében, hogy készítsen sima térképek (lásd 1. Ábra), ahelyett, hogy a csak a közelebb neuron a spektrumok SOM figyelembe vesszük, hogy egy szám n a legközelebbi neuronok, a végső érték a másodlagos szerkezet frakció a lineáris kombinációja az értékek az egyes neuronok nyomott az inverz a távolságokat. Több mint 6 szomszédos Neuron felvétele hozta a legjobb eredményeket. Jobb teljesítmény akkor érhető el, ha az extra hat referencia spektrum nem szerepel a számítás a másodlagos szerkezet Térkép, bár a teljesítmény csökkent, ha eltávolítjuk őket, valamint a képzési készlet a spectra SOM. Ezért megtartottuk őket a képzésre.