
Google a prezentat unul dintre cele mai ieftine modele de inteligență artificială disponibile
Noul model este conceput în principal pentru dezvoltatorii și companiile care trebuie să proceseze cantități mari de date în timp real. Acesta este deja disponibil într-o versiune de pre-lansare prin intermediul platformei AI Studio a Google și al serviciului cloud Vertex AI, raportează Dataconomy.
Pariul pe viteză și ieftinire
Potrivit companiei, funcționarea modelului costă 0,25 dolari pe milion de token-uri de intrare și 1,50 dolari pe milion de token-uri de ieșire, ceea ce îl face unul dintre cele mai ieftine modele din ecosistemul Gemini.
În același timp, modelul demonstrează o rată de generare ridicată. Conform testelor interne ale Google, timpul primului răspuns poate fi de până la 2,5 ori mai rapid decât versiunea anterioară a Gemini 2.5 Flash, iar viteza de generare a textului a crescut cu aproximativ 45%.
Tulsee Doshi, director senior de management al produselor pentru echipa Gemini, a declarat că noua abordare a arhitecturii modelului permite o combinație de performanță și costuri reduse.
„Gemini 3.1 Flash-Lite este cea mai rapidă și mai rentabilă variantă a modelului nostru. Aceasta este concepută pentru sarcinile dezvoltatorilor pe scară largă, unde viteza, latența redusă și optimizarea costurilor sunt importante”, a declarat Doshi.
Google a declarat că modelul este destinat unei game largi de sarcini, de la traducerea automată și moderarea conținutului până la generarea de interfețe și procesarea fluxurilor mari de date.
În evaluarea Arena.ai, noul model a primit un scor Elo de 1 432, ceea ce îl plasează la același nivel cu multe modele comerciale din generația anterioară, susține Dataconomy.
Experții consideră că lansarea Gemini 3.1 Flash-Lite reflectă o nouă tendință pe piața inteligenței artificiale – o trecere de la modele extrem de puternice la sisteme mai ieftine și mai scalabile care pot fi utilizate în milioane de aplicații și servicii.









