Projekti Genie, prototipi i inteligjencës artificiale i Google për krijimin e botëve interaktive

  • Projekti Genie kombinon Genie 3, Nano Banana Pro dhe Gemini për të gjeneruar botë virtuale interaktive nga teksti ose imazhet.
  • Qasja është e kufizuar vetëm për abonentët e Google AI Ultra në Shtetet e Bashkuara, me seanca deri në 60 sekonda dhe një rezolucion prej rreth 720p.
  • Mjeti ju lejon të skiconi, eksploroni dhe përzieni botët në kohë reale, por vuan nga probleme realizmi, probleme me latencën dhe kontroll të dobët të personazheve.
  • Aftësia e tij për të imituar lojëra të njohura hap debate rreth të drejtave të autorit dhe shqetëson një pjesë të industrisë së videolojërave.

Projekti i inteligjencës artificiale për të gjeneruar botë interaktive

Google ka ndërmarrë një hap të ri në ofensivën e saj inteligjenca artificiale e aplikuar në videolojëra dhe botëve virtuale Me lançimin e Project Genie, një prototip që u lejon përdoruesve të gjenerojnë dhe të lundrojnë në mjedise interaktive bazuar në disa kërkesa tekstuale ose një imazh, kompania e paraqet mjetin si një eksperiment që është ende në fazën e testimit. Megjithatë, demonstrimet e tij fillestare kanë ngjallur si entuziazëm ashtu edhe dyshime brenda industrisë.

Për momentin, qasja është e kufizuar në abonentë të planit Google AI Ultra në Shtetet e Bashkuarame seanca të shkurtra dhe performancë të shënuar qartë nga natyra eksperimentale e sistemit. Megjithatë, projekti tregon për një të ardhme në të cilën çdo përdorues mund të krijoni një "botë të vogël të luajtshme" brenda pak sekondash, pa pasur nevojë të dish si të programosh ose të përdorësh motorë grafikë.

Çfarë është Projekti Genie dhe çfarë teknologjish kombinon?

Gjenerator botëror me inteligjencë artificiale

Projekti Genie është një prototip kërkimor i zhvilluar nga Google DeepMind dhe Google AI i cili funksionon si një gjenerator interaktiv i botës. Themeli i tij teknik mbështetet në tre shtylla: modeli Genie 3, i specializuar në simulimin e mjediseve dinamike; Nano Banana Pro, përgjegjës për aspektet vizuale dhe skicat; dhe Gemini, modeli multimodal që interpreton udhëzimet e përdoruesit dhe vepron si asistent gjatë krijimit.

Zemra e sistemit është Genie 3, një model "botëror" i aftë të parashikojë kornizë pas kuadri se çfarë ndodh në ekranNdryshe nga teknologjitë e mëparshme që gjeneronin vetëm skena statike 3D, kjo qasje i lejon mjedisit të reagojë ndaj lëvizjeve të lojtarit në kohë reale, me një rezolucion të përafërt prej 720p dhe disa minuta koherencë vizuale sipas eksperimenteve të brendshme të DeepMind.

Është integruar mbi këtë bazë Nano Banana Pro, përgjegjës për gjenerimin e imazhit fillestar të skenës Duke filluar me një tekst përshkrues ose një imazh referimi, kjo pamje fillestare shërben si një skicë për të vendosur mbi stilin grafik, përbërjen e botës dhe pamjen e personazhit që do të kontrollohet gjatë eksplorimit.

Së fundi, Binjakët veprojnë si një shtresë orkestrimi dhe asistent.Ai interpreton udhëzimet në gjuhë natyrore, ndihmon në përshtatjen e botës menjëherë dhe lehtëson detyra të tilla si ndryshimi i perspektivës (në vetën e parë ose të tretë), ripërpunimi i një mjedisi të krijuar tashmë ose kombinimi i disa ideve në një skenar të vetëm të luajtshëm.

Si krijohen dhe eksplorohen botët virtuale

Botë interaktive të gjeneruara nga IA

Funksionimi i Projektit Genie është strukturuar rreth një proces progresiv në tre faza Google e përmbledh atë si skicim, eksplorim dhe përzierje botësh. Qëllimi është që kushdo të jetë në gjendje të kalojë nga një ide në një përvojë të vogël interaktive pa mjete shtesë.

Në fazën e parë, përdoruesi shkruan një përshkrim të botës që dëshiron të krijojë ose ngarkon një imazh referimi. Nga ky informacion, Nano Banana Pro gjeneron një pamje paraprake statike Mjedisi mund të jetë një pyll në stilin e polifonisë së ulët, një mjedis urban futurist, një peizazh historik ose çfarëdo që përshkruhet në tekst. Lloji i personazhit, mënyra e kamerës dhe disa parametra bazë të lëvizjes përcaktohen gjithashtu në këtë fazë.

Pasi skica pranohet, Genie 3 hyn në lojë për të lejuar lojtarin Eksploroni mjedisin lirisht, duke përdorur kontrollet tipike të PC-së, siç janë tastet W, A, S dhe D.Modeli gjeneron në lëvizje atë që shfaqet përpara personazhit, duke parashikuar çdo kuadër bazuar në ato të mëparshmet dhe duke ruajtur një qëndrueshmëri të caktuar kur kamera kthehet ose kthehet në një zonë të vizituar tashmë.

Aftësia e tretë kryesore është kombinimi dhe ripërzierja e botëveSistemi u lejon përdoruesve të rishikojnë skenarët e gjeneruar më parë, t'i modifikojnë ato me parametra të rinj, t'i bashkojnë së bashku ose edhe të përdorin botë të gjeneruara paraprakisht nga Google si bazë për të ndërtuar variacione. Përveç kësaj, videot e seancave mund të ndahen që përdoruesit e tjerë t'i shohin ose t'i përdorin si frymëzim.

E gjithë kjo ekzekutohet nga një aplikacion web i ngjashëm me shërbimet e tjera të Google AI, në mënyrë që Nuk ka nevojë të instalohen programe shtesë, as nuk kërkohen njohuri të avancuara teknike.Thjesht hyni në mjet, futni udhëzimet dhe filloni të testoni kombinimet derisa të gjeni një rezultat interesant.

Kufizime teknike: koha, performanca dhe realizmi

Kufizimet e një prototipi të inteligjencës artificiale për botët virtuale

Google këmbëngul në përcaktimin e Projektit Genie si një prototip kërkimor me një karakter të theksuar eksperimentalKy etiketim nuk është thjesht një formalitet: përvoja aktuale paraqet disa kufizime të qarta që kushtëzojnë përdorimin praktik të mjetit përtej kuriozitetit fillestar.

Më i dukshmi është Limiti prej 60 sekondash për seancë gjenerimi dhe eksplorimiPas asaj minute, bota fiket dhe duhet të fillojë një përvojë e re. Kompania shpjegon se ky kufizim lejon një shpërndarje më të mirë të burimeve kompjuterike, pasi çdo seancë rezervon një çip të dedikuar për përdoruesin që po luan.

Për sa i përket performancës, testet publike përshkruajnë një rezolucion afër 720p dhe një frekuencë midis 20 dhe 24 kuadrove për sekondëKëto karakteristika shoqërohen me një vonesë të dukshme të të dhënave gjatë lëvizjes së personazhit ose ndryshimit të kamerës. Sipas disa testuesve të hershëm, përvoja ndihet më shumë si një video interaktive sesa si një lojë video tradicionale plotësisht fluide.

Duhet të theksohet gjithashtu se Genie 3 Nuk është një motor klasik grafik, por një model që parashikon kuadrin tjetër. Bazuar në sa më sipër. Kjo rezulton në sjellje të çuditshme: shtigje që ndryshojnë teksturë pa asnjë arsye të dukshme, elementë që zhduken, fizikë të pabesueshme ose animacione që deformohen rastësisht.

Vetë Google paralajmëron se botët e gjeneruara "Ato mund të mos duken plotësisht të vërteta ose gjithmonë të mos përputhen me indikacionet ose ligjet e fizikës."Dhe kontrollet e personazheve mund të jenë të pasakta. Me fjalë të tjera, teknologjia premton, por është ende larg ofrimit të një përvoje të përsosur lojërash për sa i përket lojës dhe stabilitetit vizual.

Qasje e kufizuar dhe udhërrëfyes ndërkombëtar

Qasje e kufizuar në një prototip të inteligjencës artificiale

Në këtë fazë të parë, Project Genie është i disponueshëm vetëm për Klientët e Google AI Ultra në Shtetet e BashkuaraPlani më i përparuar i abonimit i kompanisë është i orientuar drejt bizneseve dhe krijuesve që kanë nevojë për aftësi të inteligjencës artificiale me performancë të lartë. Është një shërbim premium, i cili kufizon numrin e përdoruesve me qasje në eksperiment.

Vendimi për të kufizuar testimin shpjegohet si nga kostoja llogaritëse e çdo seance Kjo për shkak të interesit të Google për të mbledhur reagime të hollësishme përpara një shpërndarjeje më të gjerë. Drejtori i Kërkimeve i DeepMind, Shlomi Frutcher, theksoi se është "emocionuese" të jesh në gjendje t'i hapësh këto mjete për më shumë njerëz për të mbledhur opinione përdorimi në botën reale, por për momentin nuk ka një datë specifike për mbërritjen e tyre në Evropë ose në tregje të tjera.

Nga perspektiva e përdoruesve dhe studimeve spanjolle dhe evropiane, kjo përkthehet në faktin se, të paktën në afat të shkurtër, Roli më realist do të jetë ai i vëzhguesit.Ndiqni nga afër testet, analizoni videot që qarkullojnë tashmë në mediat sociale dhe vlerësoni se deri në çfarë mase kjo teknologji mund të integrohet në rrjedhat e punës për dizajnin e niveleve, prototipimin e shpejtë ose vizualizimin e ideve.

Google ka shprehur qëllimin e saj për të zgjeroni gradualisht aksesin Me kusht që performanca, kostot dhe çështjet ligjore ta lejojnë. Megjithatë, ritmi i këtij zgjerimi do të varet edhe nga reagimi i komunitetit dhe nga mënyra se si do të zhvillohen debatet rreth të drejtës së autorit dhe përdorimit të përgjegjshëm të përmbajtjes së palëve të treta.

Aftësia për të imituar lojëra të njohura dhe debatin për të drejtat e autorit

Një nga pikat më delikate të Projektit Genie ka qenë aftësia për të rikrijuar, me shkallë të ndryshme suksesi, botë të frymëzuara qartë nga videolojërat ekzistueseDisa gazetarë të specializuar kanë arritur të krijojnë skenarë që ngjanin qartë me tituj të tillë si Super Mario 64, Metroid Prime ose The Legend of Zelda: Breath of the Wild.

Në rastin e Zeldës, ato madje janë parë personazhe që hapin një parashutë gjatë kërcimitKy gjest është i lidhur ngushtë me lojën Nintendo. Këto rastësi sugjerojnë që modeli është trajnuar duke përdorur një numër të madh videosh loje të disponueshme publikisht, duke ngritur pyetje në lidhje me trajtimin e pronësisë intelektuale në trajnimin e inteligjencës artificiale.

Pas disa testeve në të cilat u rikrijuan botë të frymëzuara nga françiza shumë të njohura, Google ka filluar të bllokojnë gjenerimin e skenarëve dhe personazheve të caktuarSidomos kur përmenden emra ose marka tregtare specifike. Në disa raste, mjeti parandalon drejtpërdrejt krijimin e botëve të bazuara në saga të caktuara, duke përmendur "interesat e ofruesve të përmbajtjes së palëve të treta".

Kompania shpjegon se Projekti Genie është "të trajnuar kryesisht me të dhëna të disponueshme publikisht në internet"Por mos harroni se kjo përmbajtje mbetet subjekt i ligjeve të të drejtave të autorit. Rezultati është një sistem moderimi që është ende në ndërtim e sipër, në të cilin disa përpjekje për të riprodhuar vepra të mbrojtura me të drejta autori bllokohen në mënyrë të qartë, ndërsa të tjerat nuk zbatohen për sa kohë që shmangen referencat tepër të drejtpërdrejta.

Kjo sjellje e parregullt nxit debatin rreth Deri në ç'masë mund ose duhet të frymëzohet IA nga lojërat ekzistuese? Dhe ku është vija ndarëse midis homazhit, imitimit dhe kopjimit? Një debat që ka të ngjarë të jetë veçanërisht i rëndësishëm në rajone si Bashkimi Evropian, ku kornizat rregullatore mbi të dhënat e trajnimit dhe të drejtat e autorit në inteligjencën artificiale janë ende duke u përcaktuar.

Ndikim i mundshëm në industrinë e videolojërave

Përtej tërheqjes mediatike të shikimit botë "si Mario" ose "si Zelda" të gjeneruara në sekondaProjekti Genie është pjesë e një gare më të gjerë midis kompanive të mëdha të teknologjisë për të aplikuar inteligjencën artificiale gjeneruese në zhvillimin e lojërave. Microsoft, për shembull, ka zbuluar projekte si Muse për të automatizuar pjesë të procesit të projektimit dhe prodhimit, dhe kompani të tjera po eksplorojnë zgjidhje të ngjashme për të ulur kostot dhe për të përshpejtuar zhvillimin.

Në këtë kontekst, propozimi i Google synon të bëhet një mjet i shpejtë prototipizimi dhe eksperimentimi Kjo mund të jetë me interes si për studiot e pavarura ashtu edhe për botuesit e mëdhenj. Mundësia për të ndërtuar një skenar të luajtshëm nga një skicë ose një paragraf teksti mund të lehtësojë vërtetimin e hershëm të ideve, krijimin e demove të brendshme ose testimin e mekanikës pa investuar muaj të tërë pune.

Megjithatë, rritja e këtyre llojeve të zgjidhjeve po shkakton shqetësim tek disa në sektor. Nga njëra anë, Ekziston shqetësim në lidhje me ndikimin e mundshëm në profile të caktuara profesionale. Nëse një pjesë e përmbajtjes gjenerohet automatikisht. Nga ana tjetër, shumë zhvillues janë të kujdesshëm ndaj modeleve të biznesit në të cilat IA trajnohet mbi veprat e botuara tashmë pa kompensim të qartë për autorët e tyre.

Në tregjet evropiane dhe spanjolle, ku debati mbi mbrojtjen e krijimit kulturor është veçanërisht intensiv, do të jetë thelbësore të shihet se si mjete si Project Genie përshtaten në rregulloret e ardhshme. Aspekte të tilla si transparenca në lidhje me të dhënat e trajnimit, sistemet e çregjistrimit për mbajtësit e të drejtave dhe atribuimi i përmbajtjes së gjeneruar mund të bëjnë diferencën midis miratimit të kujdesshëm dhe konfliktit të vazhdueshëm me zhvilluesit dhe botuesit.

Për momentin, Projekti Genie mbetet në një fazë të hershme ku Funksionon më shumë si një laborator publik sesa si një produkt i përfunduar.Evolucioni i tij dhe mënyra se si Google i trajton çështjet ligjore dhe etike që lidhen me të, do të përcaktojë nëse ai përfundimisht do të integrohet në rrjedhat e punës në studio apo do të mbetet një eksperiment i vogël, por i kufizuar.

Megjithatë, shfaqja e këtij prototipi e bën të qartë se kompanitë e mëdha të teknologjisë e shohin në Gjenerimi automatik i botëve interaktive një terren strategjik i rendit të parë. Edhe pse përdorimi i tij aktual sot është i kufizuar dhe i mbushur me papërsosmëri teknike, drejtimi i udhëtimit është i qartë: modele gjithnjë e më të afta për të transformuar tekstin dhe imazhet në përvoja të luajtshme, dhe një industri që do të duhet të vendosë se si dëshiron të bashkëjetojë me këto mjete të reja.

Artikulli i lidhur:
Përkufizimi i realitetit virtual Çfarë duhet të dini!