18:35
Comentarii Adauga Comentariu

Queen 2.5


Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă...
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ...
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri...
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ...
  • Îmbunătățirea matematică: abilitatea matematică a lui Qwen2.5 a cunoscut o îmbunătățire rapidă...
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane...
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor...

Card model Qwen2.5

Modele Params Parametrii non-Emb Straturi Capete (KV) Încorporarea cravatei Lungimea contextului Lungimea generației Licenţă
Qwen2.5-0.5B 0,49B 0,36B 24 14 / 2 Da 32K 8K Apache 2.0
Qwen2.5-1.5B 1,54B 1,31B 28 12 / 2 Da 32K 8K Apache 2.0
Qwen2.5-3B 3.09B 2,77B 36 16 / 2 Da 32K 8K Cercetarea Qwen
Qwen2.5-7B 7,61B 6,53B 28 28 / 4 Nu 128K 8K Apache 2.0
Qwen2.5-14B 14.7B 13.1B 48 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-32B 32,5B 31.0B 64 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-72B 72,7B 70,0B 80 64 / 8 Nu 128K 8K Qwen

Performanțe Qwen2.5

Performanța modelelor Qwen2.5 este evaluată pe o gamă largă de sarcini, incluzând matematică, codare și multilingvism.

Performanță Qwen2.5-72B

Modelul de bază Qwen2.5-72B iese în evidență prin depășirea semnificativă a altor modele din categoria sa într-un spectru larg de sarcini.

Performanță Qwen2.5-14B/32B

Modelele Qwen2.5-14B și Qwen2.5-32B oferă performanțe robuste în sarcini generale precum MMLU și BBH...

Performanță Qwen2.5-7B

Modelul Qwen2.5-7B depășește atât predecesorii, cât și concurenții săi într-o gamă largă de benchmark-uri.

Concluzii

Modelele Qwen2.5 reprezintă un progres semnificativ, oferind performanțe competitive într-o gamă variată de domenii și fiind optimizate pentru utilizare în aplicații diverse.


(Mediafax)


Linkul direct catre Petitie

CEREM NATIONALIZAREA TUTUROR RESURSELOR NATURALE ALE ROMANIEI ! - Initiativa Legislativa care are nevoie de 500.000 de semnaturi - Semneaza si tu !

Comentarii:


Adauga Comentariu



Citiți și cele mai căutate articole de pe Fluierul:

_ Tot ce poate merge prost cu sânii tăi - și ce să faci în privința asta: ghidul definitiv al DR PHILIPPA KAYE

Căcărău din Isaccea alias Crin Antonescu vorbește de eliminarea stalinistă a candidaților ca și cum ar scuipa guma din gura. Nu ți-e rușine Căcărău?

_ Avocatul fraților Tate anunță o 'victorie monumentală': Curtea de Apel a decis să retrimită la DIICOT dosarul în care sunt acuzaţi viol și alte fapte grave

_ Cine este soția lui Dave Myers, Liliana Orzac? Faceți cunoștință cu femeia „remarcabilă” care l-a susținut pe starul Hairy Biker în călătoria sa „teribilă” împotriva cancerului

_ Sunt dietetician - iată 10 alimente populare care te fac pe furiș să te îngrași

_ A murit creatorul celebrului riff de chitară din filmele James Bond

_ Nicolae Ciucă fierbe după dezvăluirile Ucrainei despre Simion: Ciolacu mai că l-a făcut erou

_ O nouă privire asupra izvoarelor Grand Canyon și a posibilelor amenințări din minerit de uraniu

_ Poluare majoră în New Delhi - Școlile și șantierele eu fost închise

_ Regina Máxima a Olandei arată radiantă în timp ce vizitează Centrul Medical VieCuri

_ Câștig 100 USD pe oră ca să mă îmbrac în prințese Disney - este cea mai bună slujbă vreodată

_ Crima care îngrozeşte Viena: trei femei au fost ucise într-un bordel

_ Previziunile pieței sunt foarte optimiste

_ „Nu mai este OK”: Reprimarea libertății de exprimare din Marea Britanie vizează „ideologiile extremiste”

_ Keir Starmer se confruntă cu o presiune crescândă pentru a ignora retorica plină de sânge a Kremlinului despre „războiul nuclear până la Crăciun” și pentru a lăsa Ucraina să tragă în Rusia rachete balistice fabricate din Marea Britanie

_ Un nou pas pentru modernizarea Transalpinei, astfel încât circulaţia să fie deschisă mai mult timp

_ SURSE Marcel Ciolacu aruncă pisica în curtea lui Iohannis, în scandalul iscat în jurul lui Călin Georgescu

_ Crearea lunilor lui Marte: supercalculatoarele oferă o nouă explicație „disruptivă”.

_ ”It is absolutely impossible...” - Toni Greblă on the recount of the presidential elections

_ Lovitură totală pentru Mircea Lucescu! Scandalul cu Kosovo escaladează. Se va ajunge la tribunal

_ Inundațiile vor reduce cu 0,2 puncte procentuale creșterea Spaniei

_ Trei semne Portretul de ziua Prințesei Charlotte, realizat de Kate Middleton, nu a fost retușat

_ Avertisment urgent emis după ce un obiect de uz casnic „explodează” provocând un incendiu uriaș

_ Ucraina devine „război global” după armele occidentale cu rază lungă de acțiune împotriva Rusiei: Putin

_ Mama promite că va lupta pentru dreptate pentru fiica de 15 ani care a fost electrocutată pe șinele ferate, deoarece medicul legist spune că eșecurile poliției ar putea fi de vină

_ Prezentatoarea Newsnight Kirsty Wark îl acuză pe Gregg Wallace că a spus „povesti și glume sexualizate” la Celebrity MasterChef – în timp ce starul BBC renunță la emisiune pe fondul unei anchete privind comportamentul neadecvat

_ A treia pistă a aeroportului din Hong Kong decolează

_ Scandal la nivel înalt. Premierul australian îl numeşte pe Elon Musk un „miliardar arogant”

_ În ciuda blocajului Schengen, austriecii fac bani buni în România - Cel mai mare furnizor de energie electrică din Austria construiește un nou parc fotovoltaic

_ Cercetătorii arată că este posibil să se învețe cilii magnetici vechi trucuri noi

_ Christie flirtează cu „Fără etichete” în timp ce grupul își imaginează că aruncă cursa în casa din SUA

_ Poate o ceașcă de ceai de ciocolată să bată cu adevărat o cană de cacao încălzită?

_ Șeful pădurii Nottingham, Evangelos Marinakis, este acuzat de contravenții - deoarece Olympiacos susține că proprietarul lor este șantajat într-o declarație explozivă

_ Jesse Jane, starul porno care a 'influențat' generații de băieți, a fost găsită moartă în locuință

_ Griselda, vedeta serialului viral de pe Netflix, mesaj special pentru fanii din România/ Video

_ Firea vrea o discuție cu Piedone: 'Sunt de modă veche, să sune băiatul' (video)

_ Cum s-a diferențiat limbajul Neanderthal de umanul modern – probabil că nu au folosit metafore

_ Descoperirea care revoluționează medicina modernă: o bacterie transformă sângele în grupa sanguină universală

_ Spectroscopia attosecundă la nivel de miez dezvăluie dinamica moleculară în timp real

_ Biden spune că Israelul a oferit un nou acord de încetare a focului „cuprinzător”.

_ Polonia în alertă când vestul Ucrainei și Kievul sunt lovite de un atac aerian „masiv” rusesc

_ Două persoane reținute în Giurgiu într-un dosar de exploatare prin muncă și condiții inumane

_ Concedieri în mass-media: agenţia de presă americană Associated Press a anunţat că va reduce numărul de angajaţi

_ Eșecurile bizare vă vor lăsa să vă întrebați cum și-au păstrat slujba acești arhitecți

_ Trezorerii consideră că dacă Fed Martie-Cut nu este probabil, nici mai

_ Noul test de sânge ar putea ajuta persoanele cu poliartrită reumatoidă să prevină crizele prin detectarea semnelor de avertizare la timp pentru a acționa

_ Avioane de luptă siriene şi ruseşti au bombardat poziţii ale rebelilor din nord-vestul Siriei

_ „Abia așteptăm”: Președintele Johnson cere acțiuni la graniță în timpul unei întâlniri „intense”

_ Petrolier britanic a luat foc timp de câteva ore după atacul Houthi, arată fotografii dramatice

_ Câmpuri tăcute: un cocktail de pesticide împiedică coloniile de bondari din toată Europa

_ Tensiuni în armata ucraineană - Posibila demitere a lui Zalujnîi pune pe gânduri trupele

_ Blue-State Paradise: Vitrinele libere din New York �Creating Havoc�, aproape duble de la pandemie

_ Starliner de la Boeing se alătură clubului select de nave spațiale americane cu echipaj

_ Președintele INS, Tudorel Andrei, a fost ales membru corespondent al Academiei Române

_ Oamenii de știință ajută la dezlegarea începuturilor cosmice ale vieții

_ Un bărbat a murit şi altul a fost rănit într-un accident rutier produs pe DJ 296

_ Femeia se reîntâlnește cu familia ei CINCIzeci și doi de ani după ce a fost smulsă de pe străzile din Columbia la patru ani

_ Harwood-Bellis riscă mânia nunții de la Keane după golul Angliei

_ Atacantul francez Olivier Giroud este pregătit pentru mutarea Los Angeles FC

_ Dan Puric și-ar fi anunțat candidatura la prezidențiale din partea AUR (Presă)


Pag.1 Pag.2 Pag.3 Pag.4 Pag.5 Pag.6 Pag.7
Pag.8 Pag.9 Pag.10 Pag.11 Pag.12 Pag.13 Pag.14 Pag.15
Pag.16 Pag.17 Pag.18 Pag.19 Pag.20 Pag.21 Pag.22 Pag.23
Pag.24 Pag.25 Pag.26 Pag.27

Nr. de articole la aceasta sectiune: 1604, afisate in 27 pagini.