18:35
Comentarii Adauga Comentariu

Queen 2.5


Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă...
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ...
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri...
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ...
  • Îmbunătățirea matematică: abilitatea matematică a lui Qwen2.5 a cunoscut o îmbunătățire rapidă...
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane...
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor...

Card model Qwen2.5

Modele Params Parametrii non-Emb Straturi Capete (KV) Încorporarea cravatei Lungimea contextului Lungimea generației Licenţă
Qwen2.5-0.5B 0,49B 0,36B 24 14 / 2 Da 32K 8K Apache 2.0
Qwen2.5-1.5B 1,54B 1,31B 28 12 / 2 Da 32K 8K Apache 2.0
Qwen2.5-3B 3.09B 2,77B 36 16 / 2 Da 32K 8K Cercetarea Qwen
Qwen2.5-7B 7,61B 6,53B 28 28 / 4 Nu 128K 8K Apache 2.0
Qwen2.5-14B 14.7B 13.1B 48 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-32B 32,5B 31.0B 64 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-72B 72,7B 70,0B 80 64 / 8 Nu 128K 8K Qwen

Performanțe Qwen2.5

Performanța modelelor Qwen2.5 este evaluată pe o gamă largă de sarcini, incluzând matematică, codare și multilingvism.

Performanță Qwen2.5-72B

Modelul de bază Qwen2.5-72B iese în evidență prin depășirea semnificativă a altor modele din categoria sa într-un spectru larg de sarcini.

Performanță Qwen2.5-14B/32B

Modelele Qwen2.5-14B și Qwen2.5-32B oferă performanțe robuste în sarcini generale precum MMLU și BBH...

Performanță Qwen2.5-7B

Modelul Qwen2.5-7B depășește atât predecesorii, cât și concurenții săi într-o gamă largă de benchmark-uri.

Concluzii

Modelele Qwen2.5 reprezintă un progres semnificativ, oferind performanțe competitive într-o gamă variată de domenii și fiind optimizate pentru utilizare în aplicații diverse.


(Mediafax)


Linkul direct catre Petitie

CEREM NATIONALIZAREA TUTUROR RESURSELOR NATURALE ALE ROMANIEI ! - Initiativa Legislativa care are nevoie de 500.000 de semnaturi - Semneaza si tu !

Comentarii:


Adauga Comentariu



Citiți și cele mai căutate articole de pe Fluierul:

Ce este o Lovitură de Stat? A fost împiedecat Călin Georgescu să devină duminică seara pe 6 Decembrie 2024, Președintele României, printr-o lovitură de stat?

Fluierul.ro adreseaza o intrebare CSAT si CCR cei care au girat si au dat o adevarata Lovitura de Stat prin ANULAREA ALEGERILOR PREZIDENTIALE si INLATURAREA de la putere a Presedintelui ce urma sa fie ales. Unde e DOVADA implicarii RUSIEI?

Motivarea judecatorului

Prăbușirea criptomonedelor TerraUS și LUNA s-a datorat unui grup restrâns de speculanți care au pariat "short"

_ „Nimic nu depășește niciodată asta!” Turist uluit pe zborul easyJet filmează erupția spectaculoasă a vulcanului islandez

Tăcerea democrației: strigătul unei națiuni pentru libertate<

Editorial Cornel Dinu. SMINTEALA clasei politice înaintea unor alegeri prezidențiale compromise din start

_ Fenomen ciudat în Germania: studenții pleacă masiv să studieze în alte țări, inclusiv în România

Ca în Botswana, fiecare Institut de sondare are un candidat preferat. SOCIOPOL-ul lui Palada îl urcă pe Ponta pe locul doi.

Bilderbergul Macron: UE poate sprijini Ucraina fără aprobarea Rusiei trimițând mii de soldați din fiecare țară a UE.

Prăbușirea demografică a României se datorează în integralitatea partidelor sistemului care au condus România 35 de ani

_ Criticii critică linia de îmbrăcăminte pentru copii neutră din punct de vedere sexual a Asda, care se adresează copiilor de până la trei luni - dar supermarketul spune că există o cerere uriașă

În sondajul Atlas Intel Soroșiștul Nicușor Dan, e pe locul doi

Sorosistul Securistoid Bănescu noua Față Hidoase a Cenzurii Regimului UEist de la București

_ Primul pilot de F1 din China, Zhou, spune că „rezistența” este cheia succesului

_ URMĂȚI LIVE: Biden vizitează Francis Scott Key Bridge din Baltimore

Pieleanu "face" sondaje "la refefon"

_ Cercetările dezvăluie enigma mesteacănului creț și sugerează un marker pentru a-l recunoaște în stadiul de germinare

_ Jurgen Klopp speră ca protestul fanilor lui Liverpool să nu provoace o ruptură cu echipa

_ Mahmut Orhan, Claptone, Shimza, GORDO şi Grigoré, pe scena principală Massif

ActiveNewx - Bolojan și-a adus la Palat "societatea civilă" SOROS după modelul Iohannis pentru a discuta combaterea ”știrilor false” înainte de alegeri, adică perfecționarea cenzurii

SpaceX tocmai a făcut un pas mare spre reutilizarea amplificatorului Super Heavy al Starship

Donald Trump cere eliberarea lui Marine Le Pen și să fie lăsată să candideze. Nici un cuvânt despre anularea alegerilor și nici despre Călin Georgescu spre satisfacția sorosistilor și a slugilor lor care au dat Lovitura de Stat in România

Rezultatele sondajului Verifield

Explicația pe scurt a Tarifelir vamale impuse de Trump și cât de mult ajută economia americană

Prăbușirea Apple demonstrează că a te gudura pe lângă Trump nu este o garanție a siguranței

_ Cât de mare tehnologia consumă energie electrică și apă din America

_ 29 Noiembrie - Reduceri uriașe la Black Friday Notino.ro

_ Autobuzul psihedelic Wings 1972 cu etaj al lui Paul McCartney iese la licitație - iată cu cât s-ar putea vinde

_ Cum a fost prins un șofer băut și fără permis: Pasagerul a comandat o 'pizza' la 112

_ Alina Gorghiu, reacție după eșecul negocierilor din coaliție: 'Nu sunt chiar fericită că nu se ajunge la o concluzie/ PNL are o tradiție în a da președintele'

_ Top oficial militar a mințit despre 6 ianuarie: Avertizori

_ Israelul anunţă că va verifica ajutoarele care vin dinspre Cipru către Fâşia Gaza

_ Noi cercetări relevă copiii fără „voce” în instanțele de familie

Așadar după mintea actualului Stat Soroșist și a cohortelor de sorosisti care aplaudă: Democrația înseamnă să anulezi alegerile, să-l interzicem, să-i facem dosar penal și să-l băgăm la zdup pe cel CARE A CÂȘTIGAT ALEGERILE PRIN VOT

_ Tot ce poate merge prost cu sânii tăi - și ce să faci în privința asta: ghidul definitiv al DR PHILIPPA KAYE

_ Frontul Unit: Zara Tindall merge braț la braț cu soțul ei Mike în timp ce se alătură Prințesei Anne la serviciul pentru Regele Constantin al Greciei la Windsor - în timp ce Regele Charles și Prințul William sunt absenți

_ „Murz” Morozov, un blogger vizat de agenţii Moscovei, s-a sinucis

_ I'm A Celeb este târât într-un rând fix, deoarece telespectatorii nemulțumiți susțin că producătorii au ales DEJA un câștigător după ce au fost favorizați mai mult decât alți colegi de tabără în ultimul episod

_ România se pregătește pentru Schengen: se fac schimbări la Guvern/ VIDEO

_ „Ați votat literalmente pentru asta” – Conservatorii îl prăjesc pe liberalul David Hogg, după ce s-a plâns de costul vieții sub Bidenomics

Călin Georgescu cel mai iubit conducător al românilor din ultimii 150 de ani, alături de generalul Alexandru Averescu al cărui Mesianism i-a determinat pe țăranii români să-i bată pe nemți la Mărăști, Mărășești, Oituz, de le-a sunat apa-n cap

România propusă de Călin Georgescu vs România puciștilor dirijați de progresista UE. Iată cum arată România Puciștilor : Șomajul în rândul tinerilor e cel mai mare din UE. La țară a ajuns peste 30%

Vă sună cunoscut? Am văzut în România. Primarul Istanbulului, progresistul Imamoglu, arestat Principalul adversar al lui Erdogan, Imamoglu își anunțase candidatura la președinție in 2028

CURS-ul lui Buble îl urca pe Crin Antonescu pe locul doi. Sondaj CURS pentru alegerile prezidențiale. 59% dintre români cred că direcția țării impregnată de Puciști este greșită

Viktor Orban: "Je suis Marine!". Gunoiul de Viktor Orban de interzicerea lui Călin Georgescu nu a spus nimic desi acesta nu era condamnat deloc. Ce înseamnă să fii lipsit de caracter

_ Raport: Rusia a pierdut în Ucraina 3.000 de tancuri şi contează pe stocurile vechi

_ Un cercetător de securitate a furat milioane de dolari de la Apple

Micul Stalinist Nicușor Soros Dan ne spune că a&i lua unui om dreptul de a candida și milioanelor de români dreptul de a-l vota fără o condamnare "e o decizie corectă". Poate in URSS-ul lui Lenin, plicușor cu bani de la Soros

_ �Mă g�ndesc să renunț �n fiecare zi�: Premierul nepopular al Canadei Trudeau se confruntă cu apeluri de a se da deoparte, �n timp ce conservatorii mențin un avantaj uriaș �n sondaje

Luptătorul din Arenă

Adrian Onciu: Cine sunt, de fapt, extremiștii

Cazul Le Pen, ineligibilitate și executare provizorie: ce spune cu adevărat legea

Un nou sondaj: Simion pe primul loc, Ponta pe doi. Sondaj Verifield comandat de Nicușor Dan.

_ Ryan Reynolds și Rob McElhenney cumpără o participație la clubul mexican Necaxa - în timp ce proprietarii Wrexham caută să-și extindă imperiul fotbalistic în plină dezvoltare

_ Fermierii francezi fac presiuni asupra guvernului pentru a oferi răspunsuri cu privire la ajutor, reglementări

_ Președintelui consiliului parohial „Chelsea-on-Sea” i se spune să renunțe sau să-și înfrunte criticii după ce susține că există „ura adevărată” față de proprietarii de a doua case care „transformă zona în Center Parcs”

_ USR notifies Ombudsman, Court of Accounts on Pre-University Education Law

_ VIDEO | Cazul 'George Floyd' care a zguduit lumea se repetă - Un afroamerican a murit sub genunchiul unui polițist: 'Nu pot să respir'


Pag.1 Pag.2 Pag.3 Pag.4 Pag.5 Pag.6 Pag.7
Pag.8 Pag.9 Pag.10

Nr. de articole la aceasta sectiune: 591, afisate in 10 pagini.



ieri 12:23