Google lançon Gemma 4, bastin e saj të madh në inteligjencën artificiale të hapur dhe lokale

  • Gemma 4 është një familje me katër modele të hapura të inteligjencës artificiale bazuar në teknologjinë Gemini 3, me madhësi që variojnë nga parametrat E2B deri në 31B.
  • Modelet kombinojnë "inteligjencë të lartë parametrash" me ekzekutimin lokal në infrastrukturat mobile, periferike dhe pronësore, falë dritareve të kontekstit me deri në 256 mijë tokena.
  • Licenca Apache 2.0 lejon përdorim komercial të pakufizuar, forcon sovranitetin dixhital dhe lehtëson vendosjen në mjedise të rregulluara në Evropë.
  • Gemma 4 është multimodal (tekst, imazh, video dhe audio në modele të vogla), mbështet më shumë se 140 gjuhë dhe është i disponueshëm në Google AI Studio, Hugging Face, Kaggle dhe Ollama.

Modeli i inteligjencës artificiale Gemma 4

Google ka ndërmarrë një hap të rëndësishëm në strategjinë e saj për të... inteligjencë artificiale e hapur Me lançimin e Gemma 4, një familje e re modelesh synon të kombinojë nivele të larta arsyetimi me kërkesa shumë më modeste për harduerin. Kompania e paraqet këtë gjeneratë si një alternativë serioze për ata që duhet të përdorin inteligjencë artificiale të përparuar në infrastrukturën e tyre, nga pajisjet mobile te qendrat e të dhënave.

Larg të qenit një model i vetëm, Gemma 4 është një gamë e plotë me katër variante të hapuraI projektuar për zhvilluesit, bizneset dhe entitetet publike që duan më shumë kontroll mbi të dhënat dhe implementimet e tyre, propozimi përshtatet veçanërisht mirë me kërkesat e Sovraniteti dixhital dhe pajtueshmëria rregullatore në Evropëku fuqia për të vendosur se ku do të kryhet ekzekutimi dhe ku do të ruhen të dhënat po bëhet gjithnjë e më e rëndësishme.

Një familje me katër modele të fokusuara në "inteligjencën e bazuar në parametra"

Familja e modeleve Gemma 4

Gemma 4 është ndërtuar mbi të njëjtën bazë teknologjike si Binjakët 3Por me një objektiv të qartë: të maksimizohet ajo që Google e quan "inteligjencë e bazuar në parametra"Në vend që të konkurrojë vetëm në madhësi, kompania krenohet se ka arritur nivele performance të krahasueshme me sisteme shumë më të mëdha në modele relativisht kompakte.

Familja përbëhet nga katër madhësi të ndryshmeEfektive 2B (E2B), Efektive 4B (E4B), një model i 26B me arkitekturë të Përzierjes së Ekspertëve (MoE) dhe një variant i dendur i Parametrat 31BKjo e fundit ndodhet tashmë në 3 të parët në renditjen e Arena AI për modelet e hapura, duke tejkaluar alternativat që shumëzojnë numrin e parametrave të tij me njëzet, diçka veçanërisht e rëndësishme për ata që kërkojnë të ulin kostot e GPU-së pa sakrifikuar cilësinë.

Modeli i 26B Ministria e Mjedisit Është optimizuar për të aktivizuar vetëm një pjesë të parametrave të tij (rreth 3,8B) në inferencë, duke përmirësuar shpejtësinë e gjenerimit të tokenëve dhe efikasitetin e energjisë. Në të kundërt, versioni 31B i dendur Pozicionohet si opsioni i preferuar për detyra të kërkuara për rregullim të imët, orkestrim kompleks dhe përdorim intensiv në mjedise biznesi ose institucionale.

Google thekson se, për sa i përket testeve publike, këto variante konkurrojnë drejtpërdrejt me modele më të rënda nga ofrues të tjerë, duke përfshirë ato nga prodhuesit kinezë si DeepSeek ose Qwen, të cilët vitet e fundit ishin bërë të fortë në ekosistemin me burim të hapur. Modeli 31B i Gemma 4 është renditur si modeli i tretë më i mirë i hapur në Arena AI., ndërsa edhe Ministria e Mjedisit e 26B renditet lart.

Nga një perspektivë biznesi, ajo marrëdhënie midis madhësisë dhe performancës nënkupton më pak shpenzime hardueri, vonesë më e ulët dhe aftësinë për të ekzekutuar modele kufitare në një të vetme GPU NVIDIA H100 80GBKjo u hap derën kompanive të mesme evropiane që të punojnë me inteligjencën artificiale të përparuar pa investuar në infrastrukturë joproporcionale.

IA e vogël: celular, IoT dhe informatikë në skaje

Gemma 4 në pajisjet mobile

Modelet më të vogla, E2B dhe E4BAto janë projektuar posaçërisht për të vepruar në skajin e rrjetit, domethënë në pajisje mobile, IoT dhe harduer lokalGoogle vëren se këto variante janë optimizuar për t'u ekzekutuar në Telefonat inteligjentë Android, Mjedër PiJetson Nano dhe sisteme të tjera me energji të ulët, me vonesë shumë të ulët dhe madje edhe pa lidhje interneti.

Në këtë segment, përparësia nuk është vetëm fuqia e papërpunuar, por edhe aftësia për të ofruar funksione multimodale dhe reagim i shpejtë në mjedise me burime të kufizuara. Modelet Gemma 4 edge mund të trajtojnë tekst, imazhe dhe video, dhe në rastin e E2B dhe E4B ata shtojnë mbështetje native për audioKjo mundëson raste përdorimi të tilla si asistentët lokalë të zërit, njohja e imazheve në terren ose analiza e videos në kohë reale pa pasur nevojë të dërgoni të dhëna në cloud.

Dritarja e kontekstit për këto modele të lehta arrin Argumentet 128.000Kjo është e mjaftueshme për të përpunuar dokumente të gjata, biseda të gjera ose fragmente kodi relevante në një kërkesë të vetme. Sipas Google, ky kombinim i kontekstit të gjerë dhe ekzekutimit lokal ndihmon në eliminimin e fërkimeve. privatësia, lidhshmëria dhe vonesaKjo është shumë e rëndësishme për projektet industriale, të kujdesit shëndetësor ose arsimore në Evropë, ku kufizimet në përpunimin e të dhënave po bëhen gjithnjë e më të rrepta.

Nga perspektiva e prodhuesve të pajisjeve, Gemma 4 hap derën për integrim IA e përparuar direkt në produktet e konsumitNga telefonat inteligjentë dhe tabletët te pajisjet mjekësore dhe sensorët industrialë, kompania ka theksuar se këto modele janë projektuar për të punuar me çipe nga ofruesit e zakonshëm të ekosistemit Android, siç janë Qualcomm dhe MediaTek, duke lehtësuar përhapjen e tyre të gjerë.

Për më tepër, arkitektura e modeleve të skajeve shfrytëzon teknika të tilla si Vendosjet për shtresë (PLE) për të maksimizuar efikasitetin e përdorimit të parametrave, duke lejuar arsyetimin dhe kuptimin e kontekstit me një kosto llogaritëse shumë më të ulët se zakonisht në modelet me qëllim të përgjithshëm.

Multimodaliteti, agjentët dhe mbështetja e avancuar e zhvilluesve

4 aftësitë multimodale të Gemma-s

Një nga pikat e forta të Gemma 4 është angazhimi i saj i qartë ndaj rrjedhat e punës së agjentëveModelet nuk kufizohen vetëm në gjenerimin e tekstit: ato integrohen në mënyrë native. thirrja e funksionit, dalja e strukturuar JSON dhe udhëzimet e sistemitKjo lejon ndërtimin e agjentëve autonomë që orkestrojnë hapa të ndryshëm, thërrasin API të jashtme dhe kthejnë rezultate në formate që integrohen lehtësisht me aplikacionet e ndërmarrjeve.

Google këmbëngul se të gjitha modelet në familjen Gemma 4 janë projektuar si arsyetues të nivelit të lartëme mënyra të konfigurueshme të të menduarit për të rregulluar thellësinë e arsyetimit sipas detyrës. Kjo përkthehet në rezultate më të mira në arsyetim shumëfazor, gjenerim kodi jashtë linje dhe zgjidhja e problemeve komplekse, aspekte kyçe në mjediset e korporatave dhe të administratës publike ku kërkohet besueshmëri.

Në planin multimodal, të katër modelet mund të përpunojnë Tekst dhe imazhe me rezolucione dhe raporte aspektesh të ndryshme, ndërsa variantet E2B dhe E4B e zgjerojnë atë kapacitet në video dhe audioKy kombinim bën të mundur, për shembull, sisteme që analizojnë dokumente me grafikë, video monitorimi industrial ose përmbajtje të pasur edukative, dhe gjenerojnë përgjigje kontekstuale në kohë reale.

Dritarja e kontekstit arrin te 256.000 tokena në modelet më të mëdhaKjo u lejon përdoruesve të ngarkojnë të gjitha depot e kodit, kontrata të gjata ligjore ose vëllime të mëdha dokumentacioni teknik në një kërkesë të vetme. Për ekipet e mbështetjes, konsulencës ose auditimit të IT-së, kjo e bën më të lehtë automatizimin e detyrave që më parë kërkonin shumë orë shqyrtimi manual.

Për sa i përket gjuhëve, Gemma 4 mbështet në mënyrë native më shumë se 140 gjuhëPër Evropën, dhe konkretisht për Spanjën, kjo do të thotë se mund të zhvillohen zgjidhje shumëgjuhëshe që mbulojnë gjithçka, nga gjuhët kryesore të BE-së deri te gjuhët më pak të përfaqësuara, duke ndihmuar në përmbushjen e objektivave të aksesueshmërisë dhe përfshirjes në shërbimet publike dhe private.

Integrimi në cloud, sovraniteti dixhital dhe vendosja në Evropë

Vendosja e Gemma 4 nuk kufizohet vetëm në harduerin lokal. Google i ka integruar këto modele në ofertën e saj në cloud përmes Vertex AI y Motori Google Kubernetes (GKE)duke u lejuar organizatave të konfigurojnë burime të dedikuara kompjuterike dhe të shkallëzojnë ngarkesat e punës së nxjerrjes së përfundimeve sipas kërkesës. Për sektorët e rregulluar evropianë, kjo kombinohet me opsione për Reja Sovrane dhe vendosje me boshllëqe ajri ose në vend, të përshtatura sipas kërkesave të ruajtjes së të dhënave dhe pajtueshmërisë me Rregulloren e Përgjithshme për Mbrojtjen e të Dhënave (GDPR).

Kompania thekson se peshat precize bfloat16 të modeleve më të mëdha mund të përdoren në mënyrë efikase në një GPU e vetme NVIDIA H100 80GBduke zvogëluar barrierën e hyrjes për kompanitë e mesme ose institucionet publike që duan të ruajnë kontrollin e infrastrukturës së tyre. Në versionet e kuantizuara, modelet mund të funksionojnë edhe në pajisje ose stacione pune për konsumatorët, duke zgjeruar gamën e vendosjeve të mundshme.

Për menaxherët e teknologjisë në Spanjë dhe pjesën tjetër të Evropës, ky kombinim i model i hapur, vendosje e kontrolluar dhe mbështetje sovrane në cloud Kjo lejon projektimin e arkitekturave hibride: një pjesë e inteligjencës mund të ndodhet në qendrat lokale të të dhënave, ndërsa ngarkesa të tjera pune më pak të ndjeshme funksionojnë në cloud-in publik, duke ruajtur njëkohësisht një bazë të përbashkët teknologjike.

Përveç kësaj, Google ofron një Kompleti i zhvillimit të agjentëve (ADK)Një strukturë modulare që thjeshton krijimin, testimin dhe vendosjen e agjentëve të bazuar në Gemma 4. Ai mbështetet gjithashtu në shërbime të tilla si Funksionim në retë kompjuterike me GPU-të NVIDIA RTX PRO 6000 (Blackwell) në modalitetin pa server, i cili lejon që projektet pilot me intensitet të lartë të lançohen pa pasur nevojë të blini harduerin tuaj që nga dita e parë.

Në një kontekst evropian ku debati mbi inteligjencën artificiale zakonisht sillet rreth kontrollit, transparencës dhe auditueshmërisë, mundësia e Vendosni modele të hapura nën Apache 2.0 në infrastruktura të kontrolluara Është veçanërisht tërheqëse për administratat, bankat, kompanitë e sigurimeve ose kompanitë në sektorin e shëndetësisë që duhet të pajtojnë inovacionin me korniza të rrepta rregullatore.

Licenca Apache 2.0, ekosistem i hapur dhe tërheqje nga komuniteti

Nëse ka një aspekt që ka ngjallur interes të veçantë në komunitet, ai është vendimi për të licencuar Gemma 4 sipas Apache 2.0Versionet e mëparshme të Gemma përdornin licenca të personalizuara që ngrinin pyetje ligjore për produktet komerciale; tani, me një licencë standarde me burim të hapur, Zhvilluesit dhe kompanitë mund të modifikojnë, rishpërndajnë dhe monetizojnë modelet me shumë më pak fërkime.

Kjo hapje vjen në një kohë kur Google po përpiqet rifitoni terren në ekosistemin e modeleve të hapuraKjo vjen pas një periudhe në të cilën alternativa si Llama e Metës ose modelet kineze (DeepSeek, Qwen, GLM, Minimax) kishin fituar shkallë miratimi. Zëra me ndikim në sektor, siç është bashkëthemeluesi i Hugging Face, e kanë përshkruar këtë veprim si një "arritje të madhe" për IA-në lokale, duke theksuar se ekipet ligjore tani kanë një kornizë shumë më të qartë për miratimin e projekteve të bazuara në Gemma 4.

Ekosistemi që rrethonte familjen Gemma po tregonte forcë edhe para këtij versioni. Google vëren se gjeneratat e mëparshme i tejkalojnë... 400 milion shkarkime dhe se komuniteti ka krijuar më shumë se 100.000 variante të përshtatura për gjuhë dhe raste përdorimi të ndryshme. Ndër shembujt më të habitshëm janë modelet e specializuara në bullgare ose mjete kërkimore për kancerin, të tilla si Shkalla e Fjalive Cell2 zhvilluar në Universitetin e Yale-it.

Me Gemma 4, kompania shpreson që "Gemmaverse" do të zgjerohet edhe më tej, duke ftuar... Startup-et, universitetet dhe qendrat kërkimore evropiane për të krijuar derivatet e tyre. Kombinimi i një licence lejuese dhe peshave të hapura lejon zhvillimin e versioneve të fokusuara në sektorë specifikë, siç janë kujdesi shëndetësor, drejtësia, Industria 4.0 ose arsimi, të cilat më pas mund të ndahen ose tregtohen pa shumë kufizime.

Për kompanitë spanjolle, kjo situatë do të thotë se është e mundur të ndërtohen zgjidhje pronësore në Gemma 4 - siç janë asistentët e brendshëm, motorët e kërkimit të korporatave ose sistemet e përparuara të analizave - duke ruajtur kontrollin e kodit, të dhënave dhe infrastrukturës, diçka që përputhet mirë me trendin e forcimit të Sovraniteti teknologjik evropian.

Rastet e përdorimit: nga startup-et te korporatat e mëdha

Gemma 4 është prezantuar me një gamë të gjerë aplikacionet e mundshmeNë botën e biznesit, modelet mund të përdoren për të krijuar asistentë virtualë shumëgjuhësh i aftë të trajtojë pyetje komplekse përmes arsyetimit të avancuar, ose të automatizojë gjenerimin dhe rishikimin e kodit në ekipet e zhvillimit.

Modelet më të mëdha janë të orientuara drejt detyrave të tilla si orkestrimi i agjentëve, analiza e vëllimeve të mëdha të dokumentacionitKjo përfshin gjenerimin e raporteve teknike ose ndihmën për departamentet ligjore dhe të pajtueshmërisë. Kombinimi i dritareve me kontekst të gjerë dhe mbështetjes multimodale e bën të lehtë për një agjent të vetëm të punojë me kontrata, email-e, grafikë, imazhe të sistemit të monitorimit dhe regjistrime audio, të gjitha brenda të njëjtit fluks pune.

Në arsim dhe në sektorin publik, aftësia për të përpunuar tekst, imazhe dhe në disa raste video dhe audio, lejon krijimin e platformat e mbështetjes së të nxënit që gjenerojnë përmbledhje, shpjegime hap pas hapi ose materiale të përshtatura për nivele të ndryshme. Zbatimi lokal gjithashtu ndihmon në respektimin e kërkesave të privatësisë kur punohet me të dhëna të ndjeshme të të miturve ose grupeve vulnerabël.

Në arenën e startup-eve, Gemma 4 mund të jetë themeli i produkte vertikale Në fintech, shëndetësi dixhitale, logjistikë ose B2B SaaS, falë fleksibilitetit të ofruar nga Apache 2.0, ekipet mund të bëjnë rregullim i hollësishëm të modelit në të dhënat e tyre, ta vendosin atë në vend ose në cloud dhe ta tregtojnë rezultatin pa u lidhur me licenca të rrepta pronësore.

Veçanërisht interesante për Evropën është mundësia e zhvillimit zgjidhje lokale të inteligjencës artificiale që respektojnë rregulloret kombëtare dhe komunitare, për shembull, duke ruajtur të dhënat në qendrat e të dhënave të vendosura në territorin evropian dhe duke i mbajtur modelet nën kontrollin e drejtpërdrejtë të organizatës, gjë që mund të jetë thelbësore për projektet e lidhura me Rregulloren e ardhshme të BE-së për IA-në.

Ku dhe si të hyni në Gemma 4

Google i ka bërë të disponueshme peshat Gemma 4 përmes kanaleve të ndryshme për të lehtësuar miratimin e tyre nga zhvilluesit dhe studiuesit. Peshat e hapura mund të shkarkohen nga Përqafimi i fytyrës y GitHub, ndërsa përdorimi nëpërmjet ndërfaqes dhe API-ve është i disponueshëm në Google AI StudioIntegrimet ofrohen gjithashtu me OllamaDocker, Kaggle dhe mjete si LM Studio.

Sipas kompanisë, Gemma 4 mund të ekzekutohet lokalisht në «miliarda pajisje Android» dhe në një gamë të gjerë pajisjesh: nga GPU-të e laptopëve dhe stacione pune, deri te përshpejtues të dedikuar për zhvilluesit. Kjo përputhet me strategjinë e zgjerimit të inteligjencës artificiale të përparuar përtej qendrave të mëdha të të dhënave, në pajisjet e përdoruesit fundorë dhe mjediset e informatikës në skaje.

Për ata që duan të fillojnë me teste të shpejta, opsioni më i drejtpërdrejtë është të përdorin Google AI Studio për modelet 26B dhe 31B ose Galeria Google AI Edge në rastin e varianteve E2B dhe E4B. Paralelisht, komunitetet e zhvilluesve në platforma si Hugging Face tashmë po publikojnë adaptime dhe konfigurime të gatshme për përdorim për mjedise të ndryshme.

Në Spanjë dhe vende të tjera evropiane, pritet që integratorët lokalë dhe ofruesit e shërbimeve të menaxhuara do të fillojnë të ofrojnë zgjidhje të gatshme bazuar në Gemma 4, duke kombinuar vendosjen e shërbimeve sovrane në cloud, mbështetjen në spanjisht dhe përshtatjen me rregulloret specifike të sektorit, siç janë ato të shërbimeve financiare ose kujdesit shëndetësor.

Në përgjithësi, lançimi i Gemma 4 e pozicionon Google si një nga lojtarët më të rëndësishëm në fushën e modele të hapura dhe të ekzekutueshme në nivel lokal të AI-së, në një kohë kur industria evropiane po kërkon pikërisht mjete që kombinojnë performancë të lartë, kontroll mbi të dhënat dhe korniza të qarta licencimi për të ndërtuar produkte komerciale afatgjata.

edge AI më shumë privatësi
Artikulli i lidhur:
AI Edge dhe privatësia: AI i fuqishëm pa zbuluar të dhënat tuaja