![]() Comentarii Adauga Comentariu _ Creatori de sens: Cum standardele permit reutilizarea datelor în științele vieții![]() _ Sense makers: cum standardele permit reutilizarea datelor în științele viețiiUn pic ca sortarea unui morman dezordonat de haine într-un dulap bine aranjat, standardele minime de informații transformă datele nestructurate din articolele de jurnal în baze de date structurate. Acest lucru le permite cercetătorilor să „exploateze” mai multe seturi de date, să refolosească datele și să obțină noi perspective. Standardele minime de informații sunt linii directoare și formate pentru raportarea datelor științifice generate prin metode de mare capacitate, cum ar fi secvențierea genomului. Acestea asigură că toate seturile de date sunt structurate în același mod, făcându-le ușor de găsit, verificat și analizat de către cercetătorii din întreaga lume. Standardele oferă, de asemenea, context pentru seturile de date – de exemplu, când, unde și cum au fost generate datele sau ce specii descriu acestea. Bazele de date moleculare publice, cum ar fi cele gestionate de EMBL, asigură că datele generate o dată poate fi reutilizată din nou și din nou pentru a pune noi întrebări de cercetare, mai degrabă decât informațiile care sunt „ascunse” pe serverele laboratoarelor individuale. Aceasta este o abordare eficientă a captării datelor generate de știința finanțată din fonduri publice, ceea ce face ele ușor de accesat. Într-un fel, este similar cu a transforma grămezile de hârtie în cărți și a le cataloga sistematic la biblioteca publică, unde oricine le poate accesa. La fel cum bibliotecile joacă un rol în partajarea cunoștințelor, resursele publice de date și standardele minime de informații le permit cercetătorilor să acceseze și să utilizeze datele generate în afara propriilor laboratoare. „Trebuie să găsiți un echilibru între ceea ce este posibil și ceea ce este posibil. este practic", a explicat Alvis Brazma, Senior Team Leader la EMBL-EBI și co-autor al unora dintre primele standarde de informații minime publicate. „Oamenii care generează datele vor spune probabil că standardul necesită și ele. multe informații, iar oamenii care analizează datele vor spune că nu este suficient. Așa că trebuie să se întâlnească undeva la mijloc. „Dar important, trebuie să încercați să înțelegeți ce este necesar pentru reanaliza acum și să încercați pentru a prezice ce ar putea fi nevoie în viitor. Nu este o sarcină ușoară! Din experiența mea, cel mai bine este să începi cu un minim și să continui să adaugi la el odată ce comunitatea este la bord", spune Brazma. Standardele minime de informații au de obicei două părți. În primul rând, există un set de cerințele de raportare—prezentate de obicei sub formă de tabel sau listă de verificare. În al doilea rând, există un format de date convenit. Informațiile despre un experiment trebuie convertite în formatul de date adecvat pentru ca acesta să fie transmis în baza de date relevantă. Datele standardizate sunt esențiale pentru dezvoltarea de noi metode. Fiecare metodă de cercetare bioinformatică, fie că este vorba de a prezice noi proteine dezordonate, de a interpreta efectul modificărilor proteinelor sau de a analiza datele bioimagistice, depinde în mod critic de disponibilitatea și lipsa de ambiguitate a datelor utilizate pentru antrenează metodele. „Standardele minime de informații oferă context care îmbină rezultatele științifice în țesutul de necunoscut al „date mari””, a spus Cy Jeffries, om de știință la EMBL Hamburg și curatorul Small Angle Scattering Banca de date biologice (SASBSB). „Înseamnă că rezultatele de la diferite discipline științifice pot fi legate între ele, reutilizate și împărtășite în mod deschis pentru a găsi noi modele la care nu ne-am gândit încă, dar AI viitoare ar putea.” „În era AI, standardele minime de informații și bazele de date standardizate sunt mai importante ca niciodată, deoarece deschid datele către învățarea automată și algoritmii AI”, a explicat Jo McEntyre, director adjunct al EMBL-EBI. „Luați AlphaFold, de exemplu, sistemul AI al Google DeepMind care poate prezice cu precizie structurile proteinelor. Dezvoltarea AlphaFold pur și simplu nu ar fi fost posibilă fără datele de zeci de ani de structuri publice organizate, adnotate și funcționale din Protein Data Bank din Protein Data Bank. Europa și UniProt. Ca și în cazul multor metode de cercetare, ceea ce obții este la fel de bun ca și datele pe care le introduci.” Oamenii de știință și colegii de la EMBL au contribuit la dezvoltarea multor standarde minime de informații pentru diferite tipuri de date. Standardele urmăresc de obicei evoluțiile tehnologice și o accesibilitate îmbunătățită, ceea ce are ca rezultat o creștere a volumului de date produse. Mai jos sunt câteva exemple de standarde minime de informații care sunt acum utilizate pe scară largă în comunitatea științifică: „Consultarile comunității și acceptarea sunt cheia pentru succesul standardelor de date”, a explicat Sandra Orchard, șeful echipei de conținut pentru funcții proteice la EMBL-EBI. „Standardul trebuie să fie funcțional, așa că este adoptat în întreaga lume și sprijinit în mod ideal de editori și recenzenți. Și, desigur, generarea și partajarea publică a datelor de cercetare trebuie să fie recunoscută ca o contribuție valoroasă la știință, împreună cu alte rezultate, cum ar fi publicațiile. , dezvoltarea de instrumente software și partajarea cunoștințelor.” Standardele de date ajută la valorificarea cantității mari de date generate în științele vieții. Deși transmiterea rezultatelor cercetării către resursele publice de date și respectarea standardelor minime de informare poate fi consumatoare de timp și oneroasă, este un pas important în procesul de cercetare și poate ajuta datele să rămână utile mult timp după ce o lucrare a fost publicată. La urma urmei, s-ar putea să nu-ți facă plăcere să-ți faci ordine în dulapul, dar te simți bine odată ce ai făcut-o.
Linkul direct catre PetitieCitiți și cele mai căutate articole de pe Fluierul:
|
17:34
Luptătorul din Arenă
|
|
Comentarii:
Adauga Comentariu