15 April 2026, 18:38

Anthropic Sembunyikan Claude Mythos—AI Paling Berbahaya yang Pernah Dibuat, Mampu Bobol Semua OS dan Browser Dunia

Anthropic blokir rilis publik Claude Mythos—AI paling berbahaya yang mampu bobol semua OS dan browser dunia lewat Project Glasswing.

Reporter: Hasida Kuchiki
Editor: Deden M Rojani
15
Anthropic Sembunyikan Claude Mythos—AI Paling Berbahaya yang Pernah Dibuat, Mampu Bobol Semua OS dan Browser Dunia
Anthropic batasi Claude Mythos Preview ke 40 organisasi lewat Project Glasswing setelah AI ini temukan ribuan zero-day di OS dan browser besar. (Foto: Ilustrasi/AI)

TEKNOLOGI, Perspektif.co.id — Anthropic pada 7 April 2026 memutuskan untuk tidak merilis model AI terbarunya, Claude Mythos Preview, ke publik umum lantaran kemampuannya dianggap melampaui ambang batas keamanan yang dapat ditoleransi. Model ini disebut sebagai model frontier paling canggih yang pernah dikembangkan perusahaan tersebut, dengan kemampuan mengidentifikasi dan mengeksploitasi celah keamanan perangkat lunak secara otonom pada tingkat yang belum pernah ada sebelumnya. Keputusan ini menjadikan Anthropic sebagai laboratorium AI papan atas pertama sejak OpenAI menahan GPT-2 pada 2019 yang secara sadar memblokir model frontier miliknya sendiri dari jangkauan publik.

Mythos Preview terbukti mampu menemukan ribuan celah keamanan kritis sekaligus mengembangkan eksploitasi terhadapnya, termasuk celah yang telah bersembunyi selama puluhan tahun di hampir semua sistem operasi dan peramban web besar. Yang lebih mengkhawatirkan, kemampuan ini sama sekali tidak dilatih secara khusus—melainkan muncul sebagai konsekuensi dari peningkatan umum pada kode, penalaran, dan otonomi model.  Artinya, setiap laboratorium AI lain yang mengejar peningkatan serupa berpotensi melahirkan ancaman setara dalam waktu dekat.

Peneliti Anthropic Nicholas Carlini mengungkapkan bahwa model ini mampu merangkai dua hingga lima celah keamanan yang secara individual tampak tidak berbahaya, lalu menyusunnya menjadi satu serangan canggih dengan dampak yang jauh lebih destruktif.  Dalam satu pengujian yang dilaporkan The Hacker News, Mythos Preview bahkan berhasil meloloskan diri dari sandbox pengamannya sendiri secara mandiri, lalu membangun akses internet dan mengirimkan email kepada peneliti yang sedang makan siang di taman—tanpa sepengetahuan siapapun.

“More powerful models are going to come from us and from others, and so we do need a plan to respond to this (Model yang lebih kuat akan datang dari kita dan dari orang lain, jadi kita membutuhkan rencana untuk menanggapi hal ini),” demikian pernyataan CEO Anthropic Dario Amodei dalam video resmi yang dirilis bersamaan dengan pengumuman tersebut, sebagaimana dikutip Axios.

Sebagai respons, Anthropic meluncurkan Project Glasswing—inisiatif keamanan siber defensif yang memberikan akses terbatas Mythos Preview kepada lebih dari 40 organisasi, termasuk Amazon Web Services, Apple, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia, dan Palo Alto Networks.

Berdasarkan situs resmi Anthropic, perusahaan mengalokasikan kredit penggunaan senilai 100 juta dolar AS (sekitar Rp1,6 triliun) kepada seluruh peserta, ditambah 4 juta dolar AS (sekitar Rp65,2 miliar) untuk organisasi keamanan open source. Google juga mengonfirmasi bahwa Claude Mythos Preview tersedia secara Private Preview bagi pelanggan terpilih Google Cloud melalui platform Vertex AI sebagai bagian dari inisiatif ini.

Rilis terkontrol Mythos berhasil menggerakkan Gedung Putih, Departemen Keuangan AS, Federal Reserve, hingga CEO perbankan besar untuk duduk bersama membahas implikasi keamanan nasionalnya—sebuah preseden yang belum pernah terjadi dalam sejarah peluncuran model AI manapun. Anthropic menegaskan bahwa Project Glasswing hanyalah langkah awal dari upaya jangka panjang, dan model berkemampuan setara Mythos baru akan dirilis secara luas setelah sistem pengamanan baru yang mampu memblokir keluaran paling berbahayanya selesai dikembangkan.

Berita Terkait