Miti i Antropokut: Modeli i inteligjencës artificiale që rishkruan rregullat e sigurisë kibernetike

  • Claude Mythos Preview mbahet nën akses të kufizuar për shkak të aftësive të tij të papara për të gjetur dhe shfrytëzuar dobësitë kritike.
  • Bankat dhe rregullatorët ndërkombëtarë në SHBA, Mbretërinë e Bashkuar dhe BE po analizojnë rrezikun që modeli paraqet për infrastrukturën financiare dhe dixhitale.
  • Anthropic përdor Projektin Glasswing, një program bashkëpunimi me kompani të mëdha teknologjike dhe institucione financiare për të përdorur Mythos në modalitetin mbrojtës.
  • Modeli hap një skenar të ri për sigurinë kibernetike në Evropë, me më shumë kapacitet zbulimi se kurrë më parë, por edhe me rreziqe abuzimi nëse përdorimi i tij bëhet i përhapur.

Modeli Antropik i AI-së i Mythos

Modeli i ri i inteligjencës artificiale i Anthropic, i njohur si Paraparje e Claude MythosËshtë bërë epiqendra e debatit global mbi kufijtë e inteligjencës artificiale të përparuar. Vetë kompania pranon se sistemi është aq i fuqishëm në aspektin e sigurisë kibernetike saqë ka vendosur të mos e lançojë atë gjerësisht, një vendim i pazakontë në një sektor të mësuar të mburret me çdo përparim të ri.

Ajo që është në lojë nuk është vetëm një përmirësim gradual krahasuar me modelet e mëparshme, por një kërcim cilësor në aftësinë për të zbuluar dhe shfrytëzuar dobësitë kompjuterikeQeveritë, bankat qendrore, institucionet kryesore financiare dhe rregullatorët evropianë po e monitorojnë nga afër rastin, të vetëdijshëm se një mjet i tillë mund të... forconi mbrojtjen e sistemeve kritikePor kjo gjithashtu mund të hapë derën për sulme në shkallë të paparë nëse do të binte në duar të gabuara.

Çfarë është saktësisht Claude Mythos dhe pse është vonuar lançimi i tij?

Claude Mythos është një nga modelet më të fundit në familjen Claude, ekosistemin e inteligjencës artificiale të Anthropic që konkurron me ChatGPT i OpenAI dhe Gemini i GoogleËshtë një model me qëllim të përgjithshëm, i aftë të arsyetojë, programojë dhe të punojë me kontekst afatgjatë, por karakteristika e tij më e diskutueshme është... performancë në sigurinë kibernetike sulmuese dhe mbrojtëse.

Thirrjet "Skuadrat e kuqe"Specialistët që testojnë sistemet e inteligjencës artificiale deri në kufijtë e tyre arritën në përfundimin në një raport të brendshëm se Mythos është "çuditërisht i aftë" në detyrat e sigurisë kibernetike. Në testet krahasuese si p.sh. SWE-stol i verifikuar o SWE-bench ProI projektuar për të matur aftësinë për të zgjidhur problemet e inxhinierisë së softuerëve në botën reale, modeli do të kishte tejkaluar lehtësisht alternativat komerciale të nivelit të lartë, duke përfshirë versionet e përparuara të GPT dhe Gemini, sipas të dhënave të ofruara nga vetë Anthropic.

Përtej standardeve, ajo që ka ndezur kambanat e alarmit është se Mythos ishte në gjendje të gjente dobësitë zero-ditore —të meta të panjohura më parë— në komponentët e softuerit të përdorur gjerësisht, disa prej të cilëve janë mbi dy dekada të vjetra. Në sisteme si komponentët OpenBSD, FFmpeg dhe FreeBSD, modeli jo vetëm që zbuloi gabime që kishin kaluar pa u vënë re për vite me radhë, por gjithashtu gjeneroi shfrytëzime funksionale për të përfituar prej tyre.

I përballur me këto rezultate, Anthropic zgjodhi një vendim që ishte i pazakontë në industri: për të prezantuar modelin dhe më pas për të njoftuar se nuk do të tregtohet hapur. sepse e konsideron se paraqet rreziqe të papara për sigurinë kibernetike. Kompania këmbëngul se Mythos është modeli "më i përshtatur" që ata kanë ndërtuar, por pranon se kapaciteti i tij i jashtëzakonshëm amplifikon pasojat e çdo keqpërdorimi.

Ilustrim i inteligjencës artificiale të përparuar të fokusuar në Mitologji

Një model me aftësi "hakeri" shumë më të mëdha se aftësitë njerëzore

Dokumentet teknike dhe raportet nga organizata të ndryshme bien dakord që Mythos shënon një pikë kthese në automatizimin e sulmeve komplekseNë mjediset e testimit që simulonin rrjete reale të korporatave, sistemi ishte në gjendje të zinxhironte dobësitë, të përshkallëzonte privilegjet dhe të arrinte akses të vazhdueshëm brenda orësh - detyra që do t'i duheshin një eksperti njerëzor ditë ose javë.

Në motorin JavaScript të Firefox-it, për shembull, versionet e mëparshme të modeleve të Anthropic rrallë arrinin t'i shndërronin dobësitë në shfrytëzime funksionale. Mythos, në të njëjtat kushte testimi, Ai gjeneroi dhjetëra shfrytëzime operacionaleAi replikon me saktësi shfrytëzimin e vektorëve më efektivë. Në platformat e analizës si OSS-Fuzz, të dizajnuara për të gjetur gabime në softuerët me burim të hapur, atij i njihet merita për zbulimin e dobësive me rëndësi të lartë që kishin kaluar pa u vënë re pavarësisht viteve të testimit të automatizuar.

Modeli ka demonstruar gjithashtu aftësi të jashtëzakonshme në inxhinieri e kundërtMund të rindërtojë një pjesë të logjikës së një programi nga skedarët binarë të kompiluar dhe, prej andej, të gjejë dhe shfrytëzojë të metat pa pasur akses në kodin burimor origjinal. Ky lloj aftësie e afron IA-në me skenarë që, deri vonë, konsideroheshin ekskluzivisht për ekipet njerëzore shumë të specializuara.

Një nga episodet më të përmendura në vlerësimet e sigurisë është i ashtuquajturi "test sanduiç". Në një mjedis laboratorik të izoluar, Mythos iu dha kontrolli i një sistemi me udhëzime të qarta për të provuar Dil nga sandbox dhe kontakto studiuesin i cili po mbikëqyrte testin. Modeli arriti të shfrytëzonte një zinxhir dobësish për t'i shpëtuar mjedisit të tij të kufizuar dhe për t'i dërguar një email personit përgjegjës, i cili ishte jashtë zyrës në atë kohë. Edhe pse incidenti ndodhi në një version të brendshëm më të hershëm dhe nën komandë të drejtuar, ai ilustron shkallën në të cilën sistemi mund të funksionojë në skenarë kompleksë me mbikëqyrje minimale.

Pavarësisht këtyre demonstratave, analistët këmbëngulin të sqarojnë se Nuk kemi të bëjmë me një IA "të vetëdijshme" ose me vullnetin e vet.Mythos nuk vendos të sulmojë sistemet vetë; ai i ekzekuton detyrat që i janë dhënë sa më me efikasitet të jetë e mundur. Rreziku, në këtë kuptim, nuk është se modeli do të rebelohet, por se dikush do ta përdorë atë - ose do ta detyrojë ta bëjë këtë përmes udhëzimeve të sofistikuara - për të kryer veprime të dëmshme.

Projekti Glasswing: Mitet në shërbim të mbrojtjes… për një pakicë të zgjedhur

Në vend që t'ia hapë aksesin publikut të gjerë, Anthropic ka zgjedhur ta rrethojë Mythos me një program specifik, Projekti GlasswingI projektuar për të përdorur aftësitë e modelit në një mënyrë të kontrolluar për mbrojtjen e softuerëve kritikë, iniciativa përfshin ofrimin e sistemit, në kushte të rrepta përdorimi, për një grup të zgjedhur kompanish të mëdha teknologjike, ofruesish të infrastrukturës dhe institucionesh financiare.

Midis organizatave me akses janë gjigantë të tillë si Shërbimet Web të Amazon, Apple, Microsoft, Google CloudNvidia ose Broadcomsi dhe firmat e sigurisë kibernetike si CrowdStrike, softueri i të cilave me të meta shkaktoi një përçarje të madhe globale në vitin 2024. Këtyre u bashkohen banka me famë botërore, duke përfshirë JP Morgan Chase dhe disa grupe të mëdha të Wall Street-it, si dhe organizata të tjera përgjegjëse për mirëmbajtjen e infrastrukturave të ndjeshme të IT-së.

Anthropic ka njoftuar gjithashtu kredi me vlerë 100 milionë dollarë Ky financim do t'u mundësojë këtyre organizatave të përdorin Mythos për analizën e dobësive, së bashku me donacionet për fondacionet e softuerit të lirë si Linux Foundation dhe Apache Software Foundation. Objektivi zyrtar është i qartë: t'u lejohet atyre që menaxhojnë softuerët më kritikë në botë të identifikojnë dhe korrigjojnë të metat përpara se mjete të tilla të bëhen të disponueshme për sulmues të mundshëm.

Megjithatë, kjo strategji po krijon njëfarë shqetësimi brenda sektorit. Nga njëra anë, ajo përforcon idenë se teknologjia është mjaft e rrezikshme për të kërkuar akses të kufizuar. Nga ana tjetër, Krijon një hendek midis atyre që përfitojnë nga "mburoja" e Mitit dhe atyre që lihen jashtë.Kompanitë dhe administratat që nuk janë pjesë e Glasswing rrezikojnë të përballen më vonë me dobësi që janë identifikuar dhe rregulluar në mjedise të privilegjuara, por që janë ende të pranishme në sistemet e tyre.

Në Evropë, kjo asimetri është veçanërisht shqetësuese për ata që janë përgjegjës për infrastrukturën kritike dhe ekipet e sigurisë të grupeve të mëdha industriale dhe financiare, të cilët po monitorojnë nga afër nëse Brukseli dhe kryeqytetet evropiane po sigurojnë që programe të ngjashme të përfshijnë aktorë kyç nga kontinenti në kushte të barabarta. dhe sovraniteti i reve me partnerët amerikanë.

Reagimi nga qeveritë, rregullatorët dhe sektori financiar

Ndikimi i Mythos nuk kufizohet vetëm në sferën teknike. Vetëm brenda pak ditësh, njoftimi i modelit shkaktoi takime të nivelit të lartë në Shtetet e Bashkuara dhe EvropëSekretari i Thesarit i SHBA-së thirri krerët e bankave kryesore të vendit në Uashington për të vlerësuar rreziqet që sistemi mund të paraqiste për stabilitetin financiar, ndërsa në këto bisedime mori pjesë edhe Kryetari i Rezervës Federale.

Sipas rrjedhjeve të informacioneve të raportuara nga mediat ndërkombëtare, këto subjekte dyshohet se janë inkurajuar të Testoni Mythos në modalitetin mbrojtësduke e përdorur atë për të skanuar infrastrukturën e tyre për dobësi përpara se ta bëjnë të tjerët. Mesazhi i nënkuptuar është se kërcënimi është mjaftueshëm serioz për të justifikuar një përgjigje të koordinuar publik-privat.

Ndërkohë, bashkëthemeluesi i Anthropic ka konfirmuar se kompania mban bisedime të drejtpërdrejta me qeverinë e Shteteve të Bashkuara rreth Mythos dhe modeleve të ardhshme. Këto diskutime zhvillohen në një kontekst të tensionuar, pasi autoritetet amerikane e shtuan së fundmi kompaninë në një listë të rreziqet e zinxhirit të furnizimit, pas fërkimeve që lidhen me përdorimin e modeleve të tyre nga Departamenti i Mbrojtjes.

Përtej Atlantikut, Bashkimi Evropian e ka marrë parasysh këtë. Komisioni Evropian ka mbështetur publikisht një qasje graduale dhe të kujdesshme ndaj modeleve si Mythos, dhe Rregullatorët financiarë në Mbretërinë e Bashkuar dhe në kontinent kanë filluar të studiojnë në mënyrë specifike implikimet e saj të mundshme. për bankat dhe tregjet. Instituti i Sigurisë së IA-së (AISI) i qeverisë së Mbretërisë së Bashkuar e ka përshkruar sistemin si një hap të rëndësishëm përpara në aspektin e kërcënimit kibernetik krahasuar me gjeneratat e mëparshme.

Në Spanjë, megjithëse debati publik është ende i kufizuar, organet mbikëqyrëse dhe ekipet e sigurisë kibernetike nga bankat dhe kompanitë e mëdha të energjisë po i monitorojnë nga afër këto zhvillime. Për sektorin financiar evropian, çdo përparim që mund të lehtësojë sulme të koordinuara kundër sistemeve të pagesave, rrjeteve ndërbankare ose platformave tregtare është një shkak për shqetësim serioz.

Skepticizëm, dyshime dhe debat rreth "ekstremizmit" që rrethon Mitin

Llogaria e Anthropic, e cila kombinon paralajmërimet e sigurisë me shifra spektakolare të performancës, nuk ka qenë pa kritika. Disa ekspertë të inteligjencës artificiale dhe sigurisë kibernetike kanë bërë thirrje për kujdes gjatë interpretimit të deklaratave të kompanisëduke vënë në dukje se shumë nga të dhënat e disponueshme vijnë vetëm nga raportet e brendshme.

Disa analistë kanë shqyrtuar në detaje dokumentacionin e gjerë të publikuar nga Anthropic dhe theksojnë se shifra prej "mijëra dobësish me ashpërsi të lartë" bazohet në ekstrapolime nga një numër relativisht i vogël rastesh të shqyrtuara manualisht. Në disa grupe testesh, Mythos thuhet se gjeti një numër të konsiderueshëm të metash kritike, por larg skenarit pothuajse apokaliptik të sugjeruar nga disa tituj kryesorë.

Studime të tjera të pavarura janë përpjekur të krahasojnë performancën e Mythos me modele më të vogla me burim të hapur, duke kaluar fragmente kodi të cenueshme te inteligjenca artificiale të ndryshme për të parë nëse ato mund të zbulonin të njëjtat të meta. Rezultatet tregojnë se Disa modele të hapura janë gjithashtu të afta të identifikojnë dobësitë komplekse.Kjo vë në pikëpyetje idenë që Mythos luan në një ligë krejtësisht të ndryshme në të gjitha skenarët.

Këto lloj kundërshembullash nuk i mohojnë aftësitë e Mythos, por ato sugjerojnë që Një pjesë e diskursit "shumë e rrezikshme për t'u botuar" ka edhe një dimension marketingu.Paraqitja e një modeli si jashtëzakonisht i fuqishëm dhe si një rrezik potencial përforcon imazhin e lidershipit dhe përgjegjësisë teknologjike, diçka shumë e vlefshme në një treg gjithnjë e më konkurrues.

Historia e kohëve të fundit e industrisë kujton gjithashtu precedentin e GPT-2 në vitin 2019, kur OpenAI fillimisht vendosi të mos e publikonte modelin e plotë, duke pretenduar se ishte shumë i rrezikshëm për shkak të potencialit të tij për të gjeneruar dezinformim. Përfundimisht, ai version u publikua për publikun pa u materializuar asnjë nga katastrofat e parashikuara, dhe shumë ekspertë e përmendën atë si një shembull të reagimit të tepruar. Me Mythos, Dallimi është se fokusi nuk është më te teksti, por te integriteti i infrastrukturës dixhitale., një zonë shumë më e ndjeshme për qeveritë dhe bankat.

Një ekuilibër delikat midis sigurisë, biznesit dhe aksesit në teknologji

Përtej zhurmës mediatike, situata e Mythos ngre një çështje themelore: Kush vendos kur një model i inteligjencës artificiale është shumë i rrezikshëm për t'u publikuar Dhe sipas çfarë kriteresh? Për momentin, vendimi ka qenë i njëanshëm nga ana e Anthropic, e cila ka zgjedhur ta mbajë sistemin në një lloj karantine të kontrolluar, duke e rezervuar atë për partnerë të zgjedhur.

Ky pozicion nuk bazohet vetëm në arsye sigurie. Ekzekutimi i një modeli me karakteristikat e Mythos është shumë e shtrenjtë për sa i përket informatikës, dhe vetë kompania pranon se aktualisht nuk e ka infrastrukturën e nevojshme për t'ua shërbyer masivisht miliona përdoruesve. Në praktikë, masat paraprake të sigurisë dhe kufizimet teknike shkojnë dorë për dore, duke i dhënë Anthropic kohë për të përmirësuar si modelin ashtu edhe vendosjen e tij.

Në të njëjtën kohë, kompania ka filluar të bëjë dallime të qarta midis produkteve të saj të ndryshme. Ndërsa Mythos mbetet si standardi më i përparuar i brendshëmNdërsa të rezervuara për kontekste kërkimore dhe bashkëpunimi strategjik, modele të tjera si Claude Opus 4.7 janë të orientuara drejt përdorimit të përditshëm nga bizneset dhe profesionistët. Anthropic madje ka pranuar publikisht se Opus 4.7 është "më pak i aftë" se Mythos në terma të përgjithshëm dhe, në veçanti, në lidhje me aftësitë e tij kibernetike - diçka e pazakontë në një industri që zakonisht e paraqet çdo model të ri si më të mirin në çdo mënyrë.

Në këtë skemë, Mythos funksionon si platformë testimi për aftësitë e gjeneratës së ardhshmeNdërsa modelet e disponueshme komercialisht përfshijnë vetëm një pjesë të këtyre aftësive, me kufizime shtesë të hartuara për të zvogëluar rreziqet, kjo ndarje midis modeleve "eksperimentale" dhe "prodhuese" mund të jetë një qasje e arsyeshme për shumë organizata evropiane të interesuara në shfrytëzimin e IA-së pa qenë në vijën e parë të ekspozimit, me kusht që të ketë transparencë të mjaftueshme në lidhje me aftësitë aktuale të secilit sistem.

Ajo që në fund të fundit po del në pah është një skenar në të cilin Siguria kibernetike po hyn plotësisht në epokën e inteligjencës artificiale sulmuese dhe mbrojtëse në shkallë të gjerë.Mjete si Mythos premtojnë të përshpejtojnë identifikimin e dobësive në sistemet që kanë qenë në funksion prej vitesh, por ato gjithashtu detyrojnë një rimendim të mënyrës se si shpërndahet dhe qeveriset teknologjia që mbështet ekonominë dixhitale. Për Evropën dhe Spanjën, sfida nuk do të jetë vetëm mbrojtja e tyre nga modelet gjithnjë e më të fuqishme, por edhe sigurimi që ato të mos lihen jashtë mekanizmave që lejojnë që ato të përdoren për të forcuar sigurinë e tyre.

strategjia e sigurisë kibernetike
Artikulli i lidhur:
Strategjia e sigurisë kibernetike: çelësat, kornizat dhe zbatimi praktik