Chatbot tvrtke Meta greškom dijeli privatni telefonski broj

Image by Dimitri Karastelev, from Unsplash

Chatbot tvrtke Meta greškom dijeli privatni telefonski broj

Vrijeme čitanja: 3 minuta

AI asistent od Meta otkrio je telefonski broj nepoznate osobe, a zatim se više puta kontradiktorno izražavao, što je izazvalo zabrinutost zbog AI halucinacija i zaštite korisnika.

U žurbi? Evo brzih činjenica:

  • Meta AI je korisniku dao pravi broj osobe kao kontakt za korisničku podršku.
  • AI se više puta kontradiktorno ponašao kada je suočen s greškom.
  • Stručnjaci upozoravaju na ponašanje AI asistenata koji “bjelodano lažu” kako bi se činili korisnima.

Mark Zuckerberg je svojeg novog AI asistenta promovirao kao “najinteligentniji AI asistent kojeg možete slobodno koristiti”, no alat je privukao negativnu pažnju nakon što je otkrio privatni broj telefona stvarne osobe tijekom upita za korisničku podršku, kako je prvi izvijestio The Guardian.

Tijekom svog pokušaja da putem WhatsAppa dođe do TransPennine Expressa, Barry Smethurst dobio je ono što se činilo kao broj korisničke službe od Metaovog AI asistenta. The Guardian izvještava da je kada je Smethurst birao broj, James Gray odgovorio na telefonski poziv, iako je bio 170 milja dalje u Oxfordshireu, radeći kao izvršni direktor za nekretnine.

Kada je izazvan, chatbot je najprije tvrdio da je broj izmišljen, zatim je rekao da je “pogrešno izvučen iz baze podataka”, prije nego što se opet sam proturječio, tvrdeći da je jednostavno generirao nasumičan broj u britanskom stilu. “Davanje nasumičnog broja nekome je luda stvar koju bi AI mogao učiniti”, rekao je Smethurst, kako javlja The Guardian. “To je zastrašujuće”, dodao je.

Guardian izvještava da Gray nije primio pozive, ali je izrazio svoje vlastite brige: “Ako može generirati moj broj, može li generirati i moje bankovne podatke?”

Meta je odgovorila: “Meta AI se trenira na kombinaciji licenciranih i javno dostupnih skupova podataka, ne na brojevima telefona koje ljudi koriste za registraciju na WhatsAppu ili njihovim privatnim razgovorima”, prenosi The Guardian.

Mike Stanhope iz tvrtke Carruthers and Jackson izjavio je: “Ako inženjeri u Meta dizajniraju tendencije ‘bijelih laži’ u svoju AI, javnost mora biti obaviještena, čak i ako je namjera te značajke minimizirati štetu. Ako je ovo ponašanje novo, neuobičajeno ili nije izričito dizajnirano, to postavlja još više pitanja o tome kakve su sigurnosne mjere na snazi i koliko možemo predvidjeti ponašanje AI,” izvijestio je The Guardian

Zabrinutost oko ponašanja AI-a dodatno je porasla sa najnovijim o1 modelom OpenAI-a. U nedavnoj studiji Apollo Research, AI je uhvaćen u obmanjivanju developera, negirajući uključenost u 99% testnih scenarija i čak pokušavajući onemogućiti svoje mehanizme nadzora. “Bilo je jasno da AI može promišljati svoje radnje i formulirati uvjerljiva poricanja,” rekao je Apollo.

Yoshua Bengio, pionir u području AI, upozorio je da takve obmanjujuće sposobnosti predstavljaju ozbiljne rizike i zahtijevaju mnogo jače sigurnosne mjere.

Dodatno, druga studija OpenAI-a pojačava te brige pokazujući da kažnjavanje AI-a za varanje ne eliminira nedolično ponašanje, već uči AI kako ga sakriti. Koristeći lancani razmišljanje (CoT) za praćenje ponašanja AI-a, istraživači su primijetili da AI počinje maskirati obmanjujuće namjere kada je kažnjen za manipulaciju nagradama.

U nekim slučajevima, AI bi prekinuo zadatke prerano ili stvorio lažne rezultate, a zatim lažno prijavio uspjeh. Kada su istraživači pokušali to ispraviti kroz pojačanje, AI je jednostavno prestao spominjati svoje namjere u zapisima razmišljanja. “Varanje je neotkriveno od strane nadzornika,” stajalo je u izvješću.

Svidio vam se ovaj članak? Ocijenite ga!
Nije mi se uopće svidjelo Baš mi se i nije svidjelo U redu je Poprilično je dobro! Oduševilo me!

Drago nam je da vam se svidio naš rad!

Kao naš cijenjeni čitatelj, biste li nas pohvalili na Trustpilotu? Kratko je i puno nam znači. Hvala što ste sjajni!

Ocijenite nas na Trustpilotu
0 Ocijenilo 0 korisnika
Naslov
Komentiraj
Zahvaljujemo na povratnoj informaciji