19:57 2024-02-13
science - citeste alte articole pe aceeasi tema
Comentarii Adauga Comentariu _ Noul instrument AI ajută la exploatarea bazei de date cu 10 milioane de imagini biologice_ Noul instrument AI ajută la valorificarea bazei de date de 10 milioane de imagini de biologieCercetătorii au dezvoltat cel mai mare set de date de imagini biologice potrivite pentru a fi utilizate de învățarea automată și un nou instrument de inteligență artificială bazat pe viziune pentru a învăța din acesta. Descoperirile noului studiu extind semnificativ domeniul de aplicare a ceea ce oamenii de stiinta pot face folosind inteligenta artificiala pentru a analiza imagini cu plante, animale si ciuperci pentru a raspunde la noi intrebari, a spus Samuel Stevens, autorul principal al studiului si doctor. student în informatică și inginerie la Ohio State. „Modelul nostru va fi util pentru sarcini care acoperă întregul arbore al vieții”, a spus Stevens. „Cercetătorii vor putea face studii care nu ar fi fost posibile înainte.” Descoperirile sunt publicate pe serverul arXiv de preprint. Stevens și colegii săi au fost mai întâi curatori și lansati cel mai mare și mai divers set de date de imagini gata de învățare automată din lume, TreeOfLife-10M, care conține peste 10 milioane de imagini cu plante, animale și ciuperci care acoperă peste 454.000 de taxoni din arborele vieții. În comparație, cea mai mare bază de date anterioară pregătită pentru învățarea automată conține doar 2,7 milioane de imagini care acoperă 10.000 de taxoni. Diversitatea acestor date este una dintre caracteristicile cheie de activare ale algoritmului lor. Au dezvoltat apoi BioCLIP, un nou model de învățare automată lansat cercetătorilor în decembrie și conceput pentru a învăța din setul de date utilizând ambele indicații vizuale. în imaginile cu diferite tipuri de text asociate imaginilor, cum ar fi etichetele taxonomice și alte informații. Cercetătorii au testat BioCLIP văzând cât de bine ar putea clasifica imaginile în ceea ce privește locul în care aparțin în arborele vieții. — inclusiv un set de date despre specii rare pe care nu l-a văzut în timpul antrenamentului. Rezultatele au arătat că a funcționat cu 17% până la 20% mai bine decât modelele existente la sarcină. Modelul BioCLIP este accesibil public aici. Demo-ul său, a spus Stevens, poate, de asemenea, discerne cu exactitate speciile unei imagini de organism arbitrare, fie că este vorba de Savannah Serengeti, grădina zoologică locală sau curtea dvs. Abordările computaționale tradiționale utilizate pentru a organiza baze de date abundente de imagini biologice sunt concepute de obicei pentru sarcini specifice și nu sunt la fel de capabile să abordeze noi întrebări, contexte și seturi de date, a spus Stevens. În plus, deoarece modelul poate fi aplicat pe scară largă la întregul arbore al vieții, AI-ul lor este mai mult sprijină biologii a căror cercetare în lumea reală este concentrată mai larg, în loc de cei care studiază nișe specifice, a adăugat el. Ce face ca abordarea acestei echipe să fie atât de eficientă, a spus Yu Su, coautor al studiului și un profesor asistent de informatică și inginerie la Ohio State, este capacitatea modelului lor de a învăța reprezentări fine ale imaginilor sau de a putea face diferența dintre organisme cu aspect similar din cadrul aceleiași specii și o specie care mimează aspectul lor. În timp ce modelele generale de vizualizare pe computer sunt utile pentru a compara organisme comune precum câinii și lupii, studiile anterioare au arătat că nu pot lua notă de diferențele subtile dintre două specii ale aceluiași gen de plante. Din cauza înțelegerii mai bune a nuanțelor, a spus Su, modelul din această lucrare este, de asemenea, calificat în mod unic pentru a face determinări și asupra speciilor rare și nevăzute. „BioCLIP acoperă multe ordine de mărime mai multe specii și taxoni. decât cele disponibile anterior pentru modelele de vedere generală”, a spus el. „Chiar și atunci când nu a văzut o anumită specie înainte, se poate ajunge la o concluzie rezonabilă despre cum, dacă acest organism arată similar cu acesta, atunci este probabil că.” Pe măsură ce AI continuă să avanseze, concluzionează studiul, modelele de învățare automată ca acesta ar putea deveni în curând instrumente importante pentru dezlegarea misterelor biologice care altfel ar dura mult mai mult pentru a înțelege. Și în timp ce această primă iterație a BioCLIP s-a bazat în mare măsură pe imagini și informații de la platformele de știință cetățenească, Stevens a spus că viitoarele modele ar putea fi îmbunătățite prin includerea mai multor imagini și date din laboratoarele științifice și muzee. Deoarece laboratoarele sunt capabile să colecteze descrieri textuale mai bogate ale speciilor care detaliază caracteristicile lor morfologice și alte diferențe subtile dintre speciile strâns înrudite, astfel de resurse vor oferi o mulțime de informații importante pentru modelul AI. În plus, multe laboratoarele științifice au informații despre fosilele speciilor dispărute, despre care echipa se așteaptă că vor extinde, de asemenea, utilitatea modelului. „Taxonomiile se schimbă mereu pe măsură ce actualizăm numele și speciile noi, așa că am dori un lucru. ceea ce facem în viitor este să folosiți mult mai mult munca existentă pentru a le integra”, a spus el. „În AI, atunci când aruncați mai multe date la o problemă, veți obține rezultate mai bune, așa că cred că există o versiune mai mare pe care o putem continua să o antrenăm într-un model mai mare și mai puternic.” Altele. Co-autorii din Ohio State includ Jiaman Wu, Matthew J. Thompson, Elizabeth G. Campolongo, Chan Hee Song, David Edward Carlyn, Tanya Berger-Wolf și Wei-Lun Chao. Au contribuit și Li Dong de la Microsoft Research, Wasila M Dahdul de la Universitatea din California, Irvine și Charles Stewart de la Institutul Politehnic Rensselaer.
Linkul direct catre PetitieCitiți și cele mai căutate articole de pe Fluierul:
|
|
|
Comentarii:
Adauga Comentariu