Articles

K2D2: a fehérje másodlagos szerkezetének becslése a kör alakú dikroizmus spektrum alapján

CD spektrum és szerkezeti adatok

a fehérjékből származó 43 CD spektrum a CDPRO referenciakészlet CDDATA-ból származik.43 épített különböző közreműködők (W. C. Johnson és ). Spectra-ból áll az oldható fehérjék számára, amelyek különböző másodlagos szerkezetű összetételűek: főleg alfa (mioglobin, hemoglobin, hemeritrin stb.), elsősorban béta (elasztáz, tumor nekrózis faktor, alfa-kimotripszin stb.) és alfa / béta (trióz-foszfát-izomeráz, laktát-dehidrogenáz, lizozim, termolizin stb.) (lásd 1. táblázat). A kísérlet, hogy egy nagyobb CD adathalmaz, amely magában foglalja a 13 transzmembrán fehérjék eredményezett rosszabb teljesítményt a módszer, ami arra utal, hogy ezek a fehérjék igényelnek speciális módszer képzett csak transzmembrán fehérjék. Korábban megfigyelték a transzmembrán fehérjék másodlagos szerkezetének előrejelzésének nehézségeit a globuláris fehérjékkel képzett CD-módszerekkel .

1.táblázat teljesítmény a k2d és K2D2 referenciaértékein.

a Protein Data Bank (PDB) referenciakészletében szereplő fehérjéknek megfelelő legjobb felbontású tercier struktúrákat választottuk ki . A DSSP programot a PDB fájlokon használtuk annak érdekében, hogy másodlagos struktúraosztályt rendeljünk az egyes aminosavakhoz a referenciakészlet minden fehérjéjében. Az alfa-hélixet a H és béta-szál címkével ellátott fehérjemaradványokhoz rendeltük az E címkével rendelkezőkhöz, majd kiszámítottuk az aminosavak frakcióját a fehérjében minden konformációban (lásd az 1.táblázatot). Amellett, hogy a CDDATA.43 spectra, mi szerepel a képzési készlet hat további referencia spektrumok: három spektruma poli (L-lizin) vizes oldatban alfa, béta és véletlen konformációk, és három modell spektrumok alfa, béta és véletlen konformáció épített 15 fehérjék .

Spectra SOM és secondary structure maps

a som_pak csomag segítségével 18 × 18 neuronból álló térképet képeztek ki a 49 CD-spektrummal . A sima térképeket előállító térképméretek és képzési paraméterek kis eltérései nem okoztak nagy különbségeket a teljesítményben. A végleges térképet 100 véletlenszerűen elindított térkép átlagolásával állították elő. A spectra SOM megszerzése után két “másodlagos szerkezeti térképet” készítünk, az egyik az alfa-helixhez, a másik a béta-szálhoz. 18 × 18 csomópontos (A SOM méretével megegyező méretű) rácsokkal kezdjük, és összehasonlítjuk a képzési készlet minden spektrumát a Som neuronjaihoz kapcsolódó súlyvektorokkal. A spektrumot tekintve a Som térképen megtaláljuk a “közelebb” neuront, és a megfelelő fehérje másodlagos szerkezetének töredékét hozzárendeljük a rács ekvivalens (azonos koordináták) csomópontjához. Annak érdekében, hogy készítsen sima térképek (lásd 1. Ábra), ahelyett, hogy a csak a közelebb neuron a spektrumok SOM figyelembe vesszük, hogy egy szám n a legközelebbi neuronok, a végső érték a másodlagos szerkezet frakció a lineáris kombinációja az értékek az egyes neuronok nyomott az inverz a távolságokat. Több mint 6 szomszédos Neuron felvétele hozta a legjobb eredményeket. Jobb teljesítmény akkor érhető el, ha az extra hat referencia spektrum nem szerepel a számítás a másodlagos szerkezet Térkép, bár a teljesítmény csökkent, ha eltávolítjuk őket, valamint a képzési készlet a spectra SOM. Ezért megtartottuk őket a képzésre.

1.ábra

k2d2 webszerver bemenet és kimenet. (A) A bemeneti spektrum ablaka. B) a bemenet és az előre jelzett spektrumok összehasonlítása.

becsült maximális hiba

elvileg minél több hasonló egy adott spektrum a legközelebbi som spectra csomóponthoz, annál jobb lenne az előrejelzés. Más szóval, ha egy spektrum nagyon különbözik attól, amit a módszer “korábban látott” (mint a képzési készlet esetében), az eredmények nem várhatók nagyon pontosak. Hogy a felhasználók becsült maximális összes hiba a jóslat (mint az összeget a hibák az alfa-béta előrejelzések) használtuk a távolság a legközelebbi csomópont térkép, valamint a megfelelő megfigyelt összes hibát a viszonyítási alap. Egy adott távolságban a maximális hiba a referenciaértékben megfigyelt legnagyobb teljes hiba. Így az előrejelzés teljes hibája várhatóan kisebb lesz, mint a becsült maximális hiba. Ha a távolság nagyobb, mint amit a referenciaértékben megfigyeltek, egy üzenet jelenik meg, amely jelzi, hogy a maximális hiba becslése nem lehetséges; ebben a helyzetben a szerkezet előrejelzését nem szabad figyelembe venni.

webszerver

K2D2 elérhető a K2D2 oldalon . A felhasználóknak ki kell választaniuk a bemeneti hullámhossz-tartományt (200-240 nm vagy 190-240 nm), és meg kell adniuk a problémás fehérje spektrumát (lásd az 1a.ábrát). A spektrumnak Δε egységekben kell lennie. Mivel az eredmények jobbak a 190-240 nm hullámhossz-tartományban, ez a lehetőség akkor ajánlott, ha a felhasználó spektrumokat tud szállítani ebben a tartományban, bár fenntartjuk a rövid hatótávolságú bemenetet, mivel néha nehéz megszerezni az előbbit. Az eredmények az alfa-helixben és a béta-szálban található maradékanyagok százalékos értékeinek becsült értékeit, a becslés becsült hibáját, valamint a felhasználó bemenetével összehasonlított grafikát tartalmazzák (lásd az 1b.ábrát). A telek vizuális értékelést nyújt az előrejelzés pontosságáról.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük