18:35
Comentarii Adauga Comentariu

Queen 2.5


Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă...
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ...
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri...
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ...
  • Îmbunătățirea matematică: abilitatea matematică a lui Qwen2.5 a cunoscut o îmbunătățire rapidă...
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane...
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor...

Card model Qwen2.5

Modele Params Parametrii non-Emb Straturi Capete (KV) Încorporarea cravatei Lungimea contextului Lungimea generației Licenţă
Qwen2.5-0.5B 0,49B 0,36B 24 14 / 2 Da 32K 8K Apache 2.0
Qwen2.5-1.5B 1,54B 1,31B 28 12 / 2 Da 32K 8K Apache 2.0
Qwen2.5-3B 3.09B 2,77B 36 16 / 2 Da 32K 8K Cercetarea Qwen
Qwen2.5-7B 7,61B 6,53B 28 28 / 4 Nu 128K 8K Apache 2.0
Qwen2.5-14B 14.7B 13.1B 48 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-32B 32,5B 31.0B 64 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-72B 72,7B 70,0B 80 64 / 8 Nu 128K 8K Qwen

Performanțe Qwen2.5

Performanța modelelor Qwen2.5 este evaluată pe o gamă largă de sarcini, incluzând matematică, codare și multilingvism.

Performanță Qwen2.5-72B

Modelul de bază Qwen2.5-72B iese în evidență prin depășirea semnificativă a altor modele din categoria sa într-un spectru larg de sarcini.

Performanță Qwen2.5-14B/32B

Modelele Qwen2.5-14B și Qwen2.5-32B oferă performanțe robuste în sarcini generale precum MMLU și BBH...

Performanță Qwen2.5-7B

Modelul Qwen2.5-7B depășește atât predecesorii, cât și concurenții săi într-o gamă largă de benchmark-uri.

Concluzii

Modelele Qwen2.5 reprezintă un progres semnificativ, oferind performanțe competitive într-o gamă variată de domenii și fiind optimizate pentru utilizare în aplicații diverse.


(Mediafax)


Linkul direct catre Petitie

CEREM NATIONALIZAREA TUTUROR RESURSELOR NATURALE ALE ROMANIEI ! - Initiativa Legislativa care are nevoie de 500.000 de semnaturi - Semneaza si tu !

Comentarii:


Adauga Comentariu



Citiți și cele mai căutate articole de pe Fluierul:

_ Tot ce poate merge prost cu sânii tăi - și ce să faci în privința asta: ghidul definitiv al DR PHILIPPA KAYE

_ În ghidul de sarcină al prințesei Beatrice pentru fete elegante: de la a nu purta nicio îmbrăcăminte de maternitate până la a nu arăta cucui

_ Cine este soția lui Dave Myers, Liliana Orzac? Faceți cunoștință cu femeia „remarcabilă” care l-a susținut pe starul Hairy Biker în călătoria sa „teribilă” împotriva cancerului

_ Mata din Spania se alătură grupului de proprietari a noii echipe San Diego MLS

_ Scena Nașului din viața reală se joacă în Sicilia, când capul de cal tăiat este aruncat pe proprietatea omului de afaceri într-un avertisment înfiorător al mafiei

_ Agent de pază din Galaţi, ameninţat cu pistolul. Scandalul ar fi pornit de la o parcare neregulamentară / Video

_ ANPC: Consumatorii să refuze să cumpere produse din peşte în legătură cu care au îndoieli privind gradul de prospeţime

_ Bucureștiul a intrat direct în topul european: Capitolul la care excelează Capitala României

_ Premierul Indiei a mulțumit alegătorilor pentru victoria obținută de BJP în cadrul alegerilor din statul Maharashtra

_ Vecinul care a aruncat în joc muzica lui Bob Marley pentru a-l „batjocori” pe proprietarul casei este raportat la poliție pentru un incident fără crimă motivată de ură

_ URIAȘĂ: Judecătorul din Georgia �i permite lui Trump să facă apel la decizia de descalificare a lui Fani Willis

_ Tribunalul francez confirmă condamnarea fostului premier Fillon în scandalul „slujbelor false”.

_ „Acest lucru nu poate continua”: Scandalul legat de grațierea prezidențială pentru abuzuri sexuale asupra copiilor zguduie Ungaria lui Orban

_ Mercedes clasic se va vinde cu 42 de milioane de lire sterline: mașina de curse din 1954 condusă de legendele Fangio și Moss ar putea deveni a doua cea mai scumpă mașină vândută vreodată la licitație

_ Arheologii au descoperit că vechii producători de brânzeturi foloseau frunzele copacilor pentru a crește producția de lapte

_ Viituri pe margine înaintea raportului CPI critic

_ A fost una dintre cele mai vesele - și mai pline de farmec - vizite regale din toate timpurile. Deci poți spune ce este în neregulă cu această fotografie magnifică a reginei?

_ Emery nu va „pierde timpul” deoarece șeful Villa cere progrese

_ Șeful AIEA sosește în Iran pentru a „negocia cu înalți oficiali nucleari”

Căcărău din Isaccea alias Crin Antonescu vorbește de eliminarea stalinistă a candidaților ca și cum ar scuipa guma din gura. Nu ți-e rușine Căcărău?

_ A explodat piața imobiliară din România: Cât au ajuns să coste apartamentele

_ Restaurarea moștenirii arheologice a Mexicului la locul care i se cuvine

_ Vremea în Marea Britanie: Marea Britanie se pregătește pentru cea mai caldă zi a anului de până acum, cu temperaturile care urmează să atingă 20C - dar nu înainte ca ploaia și cerul gri să continue să lovească nordul

Bogdan Iancu, doctor în drept constituțional și conferențiar la Universitatea București, explică, într-un interviu pentru „Adevărul”, de ce decizia CCR de a anula alegerile este in afara Constitutie si a oricarei Legi

_ O pereche din Premier League este arestată pentru viol: vedetele fotbalului, ambele în vârstă de 19 ani, sunt audiate de detectivii care au percheziţionat stadionul echipei după o presupusă infracţiune raportată poliţiei

_ Democrat Equity � Progresism in Action: This Week�s Success Stories � Oakland, Philly, San Francisco

_ Cel mai mare producător de cafea din lume, prezent și în România, lovitură pentru consumatori: Va crește prețurile și va reduce dimensiunea pungilor

_ Studiul peștelui de peșteră orb oferă noi perspective asupra evoluției neuronilor din creierul vertebratelor

_ Anticul se întâlnește cu modernul, deoarece un nou metrou din Grecia prezintă comori arheologice

_ WOW! Joe Biden este �ntr-o formă at�t de proastă �nc�t primarul Los Angeles-ului, Karen Bass, intervine și răspunde la �ntrebări �n numele său (VIDEO)

_ Cele mai vechi dovezi ale utilizării efedrei găsite într-o înmormântare marocană veche de 15.000 de ani

_ Premier League: remiza între Brentford şi Manchester United. Ambele goluri ale partidei au fost marcate în prelungiri

_ UNESCO: repornirea turismului din Ucraina va costa 9 miliarde de dolari

_ Miliardarul german-american de supermarket, în vârstă de 64 de ani, care a dispărut făcând drumeții pe Matterhorn și a fost declarat mort, „locuiește cu amanta lui în vârstă de 44 de ani la Moscova”

_ Ce ne rezervă viitorul Coastei Jurasice? Preocupările cresc după ce a doua cădere de pietre în 48 de ore provoacă pericole pentru turişti - dar experţii pledează împotriva introducerii de bariere „inestetice”

_ Spania câştigă ediţia inaugurală a Ligii Naţiunilor la fotbal feminin cu o victorie în faţa Franţei

_ De ce scăpatul în somn poate fi un semn că vei dezvolta DEMENTĂ sau Parkinson în următorii 15 ani

_ Mai mulți soldați nigerieni uciși într-o ambuscadă în apropiere de Burkina Faso, granița cu Mali

_ Cum Legea de reducere a inflației a lui Biden nu a reușit să reducă costurile cu electricitatea în imagini

_ FOTO-VIDEO Tentativă de lovitură de stat în Ciad, în curs de desfășurare: oameni asasinași, focuri de armă, tancuri și blindate pe stradă

_ Videoclipul reapărut cu Kirstie Alley care dezvăluie ținutele șocante pe care le purtau părinții ei în noaptea în care mama ei a fost ucisă într-un accident de mașină, lasă internetul uluit: „De ce ai recunoaște vreodată asta?”

_ Bărbat de nouăzeci și doi de ani este arestat pentru „viol și ucidere” a unei femei sugrumată în urmă cu 57 de ani

_ Nadal, 'Regele Zgurii', lasă în urmă o moștenire de neegalat - Cum își consolidează finanțele după retragerea din tenis

_ Generalul Gerasimov reapare în public, deşi se speculase că ar fi mort

_ „În sfârșit s-a făcut”: Struff îl învinge pe Fritz la Munchen pentru titlul de debut

_ Cât costă într-adevăr ziua ta la Winter Wonderland: cum s-ar confrunta o familie de patru persoane cu factura astronomică la atracția de Crăciun înainte de a fi așezat măcar într-o singură plimbare

_ Ziua doamnelor Aintree 2024: petrecăreții încep foarte devreme în ziua a 2-a a festivalului, în timp ce concurează pentru premiul de 5.000 GBP pentru cel mai bun îmbrăcat

_ Am studiat gripa aviară timp de 20 de ani și iată de ce am încetat să mai beau lapte... pe măsură ce FDA începe să testeze vacile de lapte pentru virusul mortal

_ Brighton 0-2 Man City - Premier League - Scor live, știri și actualizări ale echipei, când Kevin de Bruyne marchează O lovitură de cap INCREDIBILĂ înainte ca Phil Foden să deviere din lovitură liberă

_ Un oficial local spune că lovitura israeliană a ucis 3 în sudul Libanului

_ VIDEO | Explozie uriașă la o uzină din Rusia care produce rachete balistice

_ Dacia dă lovitura și devine mașina oficială a Guvernului: Marcel Ciolacu s-a ținut de promisiunea făcută la Mioveni

_ Guvernul decontează vizele de SUA pentru anumiți bugetari - De ce ar fi un pas important pentru ridicarea vizelor

_ Un atac israelian asupra Beirutului l-a ucis pe purtătorul de cuvânt al Hezbollah, Mohammed Afif

_ Victoria Beckham și-a rupt piciorul după ce a căzut în sala de sport, în timp ce soțul ei David împărtășește o fotografie cu troterul ei rănit într-o cizmă medicală

_ Timiş: Alianţa Dreapta Unită a stabilit candidaţii - Fritz la Primăria Timişoarei, Alin Nica la preşedinţia CJ

_ Copiii pot asista la meciul Dinamo-Petrolul, din play-out-ul Superligii

_ VIDEO Cristela Georgescu sare în apărarea soțului: 'Am trecut prin două cezariene, cum ar putea să interzică cezariana?'

_ Peste 4.000 de români au votat în secţiile din străinătate până sâmbătă, la ora 9.00

_ Sydney Sweeney „nu este drăguță și nu poate juca”, declară producătorul de top de la Hollywood Carol Baum, numindu-și filmul Anyone But You „nevizionabil”


Pag.1 Pag.2 Pag.3 Pag.4 Pag.5 Pag.6 Pag.7
Pag.8 Pag.9 Pag.10

Nr. de articole la aceasta sectiune: 554, afisate in 10 pagini.