Anthropic lança Claude Fable 5 com novas salvaguardas

Anthropic lança Claude Fable 5 com novas salvaguardas



A Anthropic lançou Claude Fable 5 como um modelo da classe Mythos geralmente disponível com novos controles de segurança. Segundo a empresa, o Fable 5 pode lidar com tarefas mais longas e complexas do que os modelos anteriores de Claude.

Resumo

  • A Anthropic lançou o Claude Fable 5 como um modelo da classe Mythos geralmente disponível com controles de segurança adicionais.
  • Algumas solicitações de segurança cibernética, biologia, química e destilação recairão em Claude Opus 4.8.
  • O acesso do Claude Mythos 5 começa com defensores cibernéticos aprovados, fornecedores de infraestrutura e, posteriormente, pesquisadores de biologia selecionados.

O lançamento também inclui Claude Mythos 5 para defensores cibernéticos e fornecedores de infraestrutura selecionados.

Claude Fable 5 entra em lançamento geral

Claude Fábula 5 é agora disponível aos usuários por meio dos produtos Claude e da API Claude. Os desenvolvedores podem acessar o modelo por meio do identificador de API claude-fable-5. A Anthropic disse que o Fable 5 tem um forte desempenho em engenharia de software, trabalho de conhecimento, visão e pesquisa científica.

Além disso, a Anthropic observou que o modelo tem sua maior vantagem em tarefas mais longas e complexas. A empresa disse que o Fable 5 pode funcionar de forma autônoma por períodos mais longos do que antes Modelos Claude. Ele também disse que o modelo pode permanecer focado em milhões de tokens em tarefas de longa duração.

Em testes de software, Stripe relatou que o Fable 5 completou uma grande migração Ruby em um dia. Stripe disse que a mesma migração levaria mais de dois meses para uma equipe trabalhar. A Anthropic também citou fortes resultados em tarefas de finanças, visão, memória e pesquisa científica. No entanto, a empresa disse que o lançamento exigiu controles extras devido às capacidades do modelo.

As salvaguardas encaminham algumas consultas para o Opus 4.8

A Anthropic disse que algumas solicitações do Fable 5 voltarão para Claude Opus 4.8. O substituto se aplica a consultas selecionadas relacionadas a segurança cibernética, biologia, química e destilação. A empresa disse que as salvaguardas são acionadas em menos de 5% das sessões, em média. Ele também disse que mais de 95% das sessões do Fable não envolvem substitutos.

Antrópico disse que as salvaguardas podem detectar solicitações inofensivas porque as ajustam de forma conservadora. A empresa disse que quer reduzir os falsos positivos após o lançamento. A empresa adicionou novos classificadores para detectar possíveis usos indevidos e tentativas de jailbreak.

Esses sistemas evitam que o Fable 5 responda diretamente às solicitações sinalizadas. A Antthropic disse que os controles de segurança cibernética cobrem a exploração e outras tarefas cibernéticas ofensivas. A empresa disse que as salvaguardas biológicas e químicas cobrem muitas solicitações devido aos riscos de dupla utilização.

O acesso ao Mythos 5 começa com grupos confiáveis

A Anthropic também lançou o Claude Mythos 5 para um grupo menor de usuários aprovados. A empresa disse que o Mythos 5 usa o mesmo modelo subjacente do Fable 5. O Mythos 5 começa por meio do Projeto Glasswing em cooperação com o governo dos EUA. A Antthropic disse que o programa inclui defensores cibernéticos e fornecedores de infraestrutura de software crítica.

A empresa disse que o Mythos 5 levanta algumas salvaguardas para usuários aprovados de segurança cibernética. Também planeja um programa de acesso confiável para pesquisadores e empresas de biologia selecionados. A Antthropic disse que o tráfego de clientes empresariais em Modelos da classe Mythos enfrentará retenção de 30 dias. A empresa disse que não usará esses dados para treinar novos modelos de Claude.

A empresa definiu o preço para Fable 5 e Mythos 5 em US$ 10 por milhão de tokens de entrada. Também definiu o preço de produção em US$ 50 por milhão de tokens. Fable 5 está incluído nos planos Pro, Max, Team e empresariais baseados em assentos até 22 de junho. A partir de 23 de junho, a Anthropic disse que o uso exigirá créditos, a menos que a capacidade permita uma extensão.



POstagem Original.