DNA anotacija

Izvor: Hrvatska internetska enciklopedija
Prijeđi na navigaciju Prijeđi na pretraživanje

DNA anotacija ili bilježenje genoma postupak je identificiranja mjesta gena i svih kodirajućih područja u genomu te određivanja onoga što ti geni rade. Anotacija (neovisno o kontekstu) je bilješka dodana u obliku objašnjenja ili komentara. Nakon što se genom sekvencira, potrebno ga je označiti kako bi imao smisla. [1]

DNA bilješka, koja je prethodno bila nepoznati slijed prikaz genetskog materijala, obogaćena je podacima koji se odnose na genomski položaj na intron-egzon granicama, regulatornim sekvencama, ponavljanjem, imenima gena i proizvoda proteina . Ta bilješka pohranjuje se u genskim bazama podataka, kao što su Mouse Genome Informatics, FlyBase i WormBase. Edukativni materijali o nekim aspektima biološkog bilježenja, i sličnih događaja s anotacijskog kampa Gene Ontology iz 2006. godine, dostupni su na web stranici Gene Ontology.[2]

Nacionalni centar za biomedicinsku ontologiju (www.bioontology.org) razvija alate za automatizirano bilježenje [3] zapisa baze podataka na temelju tekstualnih opisa tih zapisa.

Kao općenita metoda, dcGO [4] ima automatizirani postupak za statističko zaključivanje povezanosti između ontoloških pojmova i proteinskih domena ili kombinacija domena iz postojećih anotacija na razini gena/proteina.

Postupak

Anotacija genoma sastoji se od tri glavna koraka:. [5]

  1. identificiranje dijelova genoma koji ne kodiraju proteine
  2. identificiranje elemenata na genomu, proces koji se naziva predviđanje gena
  3. dodavanje bioloških informacija tim elementima

Alati za pokušaj automatske anotacije pokušavaju izvesti te korake pomoću računalne analize, za razliku od ručnih zabilješki (kuracija) koje uključuju ljudsku stručnost. U idealnom slučaju, ti pristupi koegzistiraju i međusobno se nadopunjuju u istom nizu anotacija.

Jednostavna metoda bilježenja gena oslanja se na alate za pretraživanje temeljene na homologiji, poput BLAST-a, u potrazi za homolognim genima u određenim bazama podataka; dobivene informacije se zatim koriste za označavanje gena i genoma. [6] Međutim, kako se informacije dodaju na platformu anotacija, ručni bilježnici postaju sposobni dekonvolitirati odstupanja između gena kojima je dana ista anotacija. Neke baze podataka koriste informacije o kontekstu genoma, rezultate sličnosti, eksperimentalne podatke i integracije drugih resursa za pružanje anotacija o genomu kroz svoj Pristup podsustavima. Ostale baze podataka (npr. Ensembl ) oslanjaju se na izabrane izvore podataka kao i niz različitih softverskih alata u svom automatiziranom nizu za bilježenje genoma. [7]

Strukturna napomena sastoji se od identifikacije genskih elemenata.

  • ORF-ovi i njihova lokalizacija
  • struktura gena
  • regije kodiranja
  • mjesto regulatornih motiva

Funkcionalna napomena sastoji se od pridavanja bioloških informacija genomskim elementima.

  • biokemijska funkcija
  • biološka funkcija
  • uključena regulacija i interakcije
  • ekspresija

Ovi koraci mogu uključivati i biološke eksperimente i in silico analizu. Pristupi temeljeni na proteogenomiji koriste informacije iz eksprimiranih proteina, često izvedenih iz masene spektrometrije, za poboljšanje genomskih anotacija.[8]

Raznovrsni softverski alati razvijeni su kako bi znanstvenicima omogućili pregled i dijeljenje genomskih bilješki; na primjer MAKER.

Bilježenje genoma ostaje glavni izazov znanstvenicima koji istražuju ljudski genom, sada kada su sekvence genoma više od tisuću ljudskih jedinki (Projekt 100 000 genoma, Velika Britanija) i nekoliko modelnih organizama uglavnom dovršene. [9] [10] Identificiranje mjesta gena i drugih elemenata genetske kontrole često se opisuje kao definiranje biološkog "popisa dijelova" za sastavljanje i normalan rad organizma. [6] Znanstvenici su još uvijek u ranoj fazi definiranja ovog popisa dijelova i razumijevanja kako se svi dijelovi "spajaju jedan s drugim". [11]

Bilježenje genoma aktivno je područje istraživanja i uključuje niz različitih organizacija u zajednici nauka o životu koje svoje napore objavljuju u javno dostupnim biološkim bazama podataka dostupnim putem weba i drugih elektroničkih sredstava. Ovdje je abecedni popis tekućih projekata relevantnih za označavanje genoma:

Na Wikipediji se anotacija genoma počela automatizirati pod pokroviteljstvom Gene Wiki portala koji upravlja robotom koji skuplja genske podatke iz istraživačkih baza podataka i na toj osnovi stvara gene. [12]

Reference

  1. Medical Definition of Genome annotation,
  2. GO Teaching Resources, Arhivirano iz izvornika 24. lipnja 2014.,
  3. NCBO Annotator (14. veljače 2020.),
  4. • Nepoznat parametar: issue
    • Parametar type nije dopušten u klasi journal
  5. • Nepoznat parametar: issue
    • Parametar type nije dopušten u klasi journal
  6. 6,0 6,1 . Bioinformatics and functional genomics ID: bioinformatics_and_functional_genomics.
  7. Gene annotation in Ensembl (14. veljače 2020.),
  8. • Nepoznat parametar: author8
    • Nepoznat parametar: author6
    • Nepoznat parametar: issue
    • Nepoznat parametar: author4
    • Nepoznat parametar: pmc
    • Nepoznat parametar: author10
    • Nepoznat parametar: author7
    • Nepoznat parametar: issn
    • Nepoznat parametar: author5
    • Nepoznat parametar: author9
    • Nepoznat parametar: author11
    • Parametar date nije dopušten u klasi journal
    • Parametar pmid nije dopušten u klasi journal
    • Parametar type nije dopušten u klasi journal
  9. • Nepoznat parametar: issue
    • Parametar type nije dopušten u klasi journal
  10. • Nepoznat parametar: issue
    • Parametar type nije dopušten u klasi journal
  11. • Nepoznat parametar: issue
    • Parametar type nije dopušten u klasi journal
  12. • Nepoznat parametar: issue
    • Parametar type nije dopušten u klasi journal