Strona główna Aktualności Podgląd mitologii Anthropic

Podgląd mitologii Anthropic

16
0

Startup ponoć utworzył Projekt Glasswing z partnerami Big Tech i omawia możliwości modelu z rządem USA

Amerykańska firma sztucznej inteligencji (AI) Anthropic wybudowała nowy model, który jest zbyt potężny, aby udostępnić go publicznie, zgodnie z informacjami kierownictwa firmy, jak podają różne media.

Firma powiedziała w środę, że omawia z rządem USA model o nazwie Claude Mythos Preview i jego możliwości.

Wiadomość ta pojawia się miesiąc po tym, jak prezydent USA Donald Trump zbanował agencjom rządowym korzystanie z AI Anthropic przez sześć miesięcy, oskarżając firmę o naciskanie na Pentagon i zagrażanie bezpieczeństwu narodowemu. Wtedy Departament Obrony USA zawarł umowę z rywalem firmy, OpenAI, aby korzystać z jego narzędzi w poufnych systemach wojskowych.

Wewnętrzne materiały na temat niezrealizowanego modelu Claude Mythos zostały nieumyślnie ujawnione w lutym po tym, jak tysiące dokumentów zostało zostawione w publicznym cache danych.

Także w tym miesiącu Anthropic w wyniku błędu opublikował ponad 500 000 linii tajnego kodu dla swojej AI Claude, w tym nieopublikowane funkcje i notatki programistów, określając to jako „błąd ludzki, a nie naruszenie bezpieczeństwa”.

Nowy model Anthropic jest „niezwykle autonomiczny” i potrafi rozumować jak zaawansowany badacz z dziedziny bezpieczeństwa, Logan Graham, kierownik zespołu czerwonego zespołu firmy, powiedział Axios. Powiedział, że potrafi wykrywać dziesiątki tysięcy luk i, w odróżnieniu od poprzednich modeli, generować odpowiadające im exploit’y.

W wywiadzie dla New York Times Graham podkreślił, że model oznacza „punkt wyjścia do tego, co uważamy za przełom w branży, albo rozliczenie, z tym, co teraz musi się wydarzyć”.

W środę w blogu Anthropic powiedział, że model Mythos będzie dostępny tylko dla wybranej grupy firm technologicznych i cyberbezpieczeństwa, powołując się na obawy związane z jego zdolnością do znajdowania i wykorzystywania luk w bezpieczeństwie. Firma dodała, że nie będzie on dostępny publicznie, dopóki nie zostaną wprowadzone zabezpieczenia mające na celu ograniczenie jego najbardziej niebezpiecznych możliwości.

Zamiast szeroko udostępniać technologię, Anthropic planuje udostępnić dostęp poprzez nowe partnerstwo branżowe, Projekt Glasswing. Inicjatywa, która obejmuje ponad 40 organizacji, takich jak Apple, Amazon, Microsoft, Google i NVIDIA, będzie testować zdolność modelu do identyfikowania i pomagania naprawić luki w istotnym oprogramowaniu.

Anthropic powiedział, że udostępnił model zewnętrznym grupom, w tym organizacjom rządowym USA, aby ocenić kluczowe ryzyka, takie jak: cyberbezpieczeństwo, utrata kontroli, CBRN oraz szkodliwa manipulacja. Wyniki te zostały uwzględnione w ogólnej ocenie ryzyka firmy.