TranslateGemma, nova porodica modela prevođenja

GlavnaVESTITranslateGemma, nova porodica modela prevođenja
- Advertisement -

TranslateGemma, nova porodica modela prevođenja koju je Google predstavio

Gugl je objavio novi paket otvorenih modela prevođenja zasnovan na svom modelu Gemma 3 otvorene težine. Gugl naziva paket „značajnim korakom napred u otvorenom prevođenju“. Nova kolekcija, TranslateGemma, može da podrži do 55 jezika, uključujući i one popularne koje biste očekivali, poput španskog, francuskog, kineskog i hindi jezika.

Ova objava je stigla samo nekoliko sati nakon što je OpenAI objavio ChatGPT Translate. ChatGPT Translate se više fokusira na prevođenje sa ispravnim tonom i kontekstom, nego samo na direktnu zamenu reči. Ima interfejs sa dva panela sa automatskim otkrivanjem jezika sa leve strane i ciljnim jezikom sa desne strane, slično alatima poput Google Translate-a.

U svakom slučaju, TranslateGemma je dostupan u veličinama parametara od 4B, 12B i 27B. Prema Guglu, model od 12B nadmašuje osnovni model Gemma 3 od 27B kada se meri na WMT24++ benčmarku. Za programere, dobijanje takvih performansi iz modela sa manje od polovine parametara znači veći protok i manju latenciju bez žrtvovanja tačnosti.

Otvoreni model prevođenja

TranslateGemma, nova porodica modela prevođenja

Gugl je rekao da je 4B model optimizovan za mobilno zaključivanje i da je 12B model pogodan za potrošačke laptopove. Međutim, velikom 27B modelu je potrebna veća snaga, poput jednog NVIDIA H100 u oblaku. Testovi na Vistra benčmarku za prevođenje slika pokazali su da TranslateGemma može bolje da prevodi tekst unutar slika, iako nije posebno fino podešen za to.

Gugl je takođe napomenuo kako je postigao ovu gustinu inteligencije kroz specijalizovani dvostepeni proces. Prvo, koristio je nadgledano fino podešavanje, trenirajući osnovne Gemma 3 modele na mešavini ljudski prevedenih tekstova i visokokvalitetnih sintetičkih podataka koje su generisali Gemini modeli.

Nakon toga, implementirao je fazu učenja pojačanjem. Ova druga faza koristila je grupu modela nagrađivanja, uključujući napredne metrike poput MetricX-QE i AutoMQM, kako bi usmerila modele ka prirodnijim i kontekstualno tačnijim prevodima.

Modeli TranslateGemma dostupni su za preuzimanje na Kaggle i Hugging Face za svakoga ko želi da eksperimentiše sa njima ili da gradi na njima.

Više info na Gugl blogu ovde.

- Advertisement -

IT & GAMING VESTI

Reklama

- Sponzorisano -

Pretplatite se na newsletter

Arhiva

- Sponzorisano -
Mihailo Ivanjac
Mihailo Ivanjachttps://sajbersfera.in.rs/
Osnivač i glavni urednik portala je Mihailo Ivanjac, bivši televizijski spiker/voditelj i senior video editor na RTV Belle amie, sa višegodišnjim iskustvom u IT industriji i administraciji serverskih sistema. Kao Linux administrator i WordPress developer, Mihailo kombinuje tehničko znanje sa novinarskim iskustvom kako bi čitaocima ponudio pouzdane i razumljive informacije.

Možda vas zanima?