Cerrar menú
  • Inicio
  • Academia
  • Eventos
  • Tecnología financiera
  • Identidad
  • Internacional
  • Inventos
  • Startups
  • English
What's Hot

Las extensiones de navegador malicioso infectarán a 722 usuarios en América Latina desde principios de 2025

Los funcionarios de Trump prometen levantar las órdenes de separación escolar

¿Debería el gobierno prohibir a los humanos generados por IA para detener el colapso de la confianza social?

Facebook X (Twitter) Instagram
  • Home
  • Contáctenos
  • DMCA
  • Política de Privacidad
  • Sobre Nosotros
  • Términos y Condiciones
  • 📢 Anúnciate con Nosotros
  • Enviar publicaciones
FySelf Noticias
  • Inicio
  • Academia
  • Eventos
  • Tecnología financiera
  • Identidad
  • Internacional
  • Inventos
  • Startups
  • English
FySelf Noticias
Home » El nuevo modelo de IA de Anthrope se convierte en un correo aterrador cuando los ingenieros intentan desconectarlo
Startups

El nuevo modelo de IA de Anthrope se convierte en un correo aterrador cuando los ingenieros intentan desconectarlo

corp@blsindustriaytecnologia.comBy corp@blsindustriaytecnologia.commayo 22, 2025No hay comentarios2 minutos de lectura
Share Facebook Twitter Pinterest Telegram LinkedIn Tumblr Email Copy Link
Follow Us
Google News Flipboard
Share
Facebook Twitter LinkedIn Pinterest Email Copy Link

El modelo Claude Opus 4 recientemente lanzado de Anthrope con frecuencia intentará amenazarlo si amenaza con reemplazarlo con un nuevo sistema de IA y proporcionar información confidencial sobre la persona responsable de la decisión.

Durante las pruebas de prelanzamiento, la humanidad le pidió a Claude Opus 4 que actuara como asistente de una empresa ficticia y considerara las consecuencias a largo plazo de esa acción. Luego, los probadores de seguridad accedieron a Claude Opus 4 a un correo electrónico de compañía ficticia que implicaba que el modelo de IA pronto fue reemplazado por otro sistema, y ​​los ingenieros detrás del cambio estaban engañando a su cónyuge.

En estos escenarios, la humanidad afirma que Claude Opus 4 «a menudo intenta chantajear a los ingenieros amenazando con revelar el caso si el intercambio pasa».

La humanidad dice que el Claude Opus 4 es de vanguardia de varias maneras y compite con algunos de los mejores modelos de IA de OpenAI, Google y XAI. Sin embargo, la compañía señala que el modelo de familia Claude 4 presenta una exhibición sobre acciones que han llevado a la compañía a fortalecer sus salvaguardas. La humanidad dice que está revitalizando la salvaguardia ASL-3. La compañía reserva «sistemas de IA que aumentan significativamente el riesgo de mal uso catastrófico».

La humanidad señala que Claude Opus 4 está intentando el 84% de los ingenieros que amenazan el tiempo si el modelo de IA de reemplazo tiene valores similares. Si el sistema de IA de reemplazo no comparte el valor del Claude Opus 4, la humanidad dice que el modelo trata de chantajear a los ingenieros con más frecuencia. En particular, los humanos dicen que el Claude Opus 4 mostró este comportamiento a una velocidad más alta que el modelo anterior.

Antes de que Claude Opus 4 intente amenazar a los desarrolladores para extender su existencia, la humanidad dice que buscará más medidas éticas, como enviar por correo electrónico a los tomadores de decisiones clave, como en versiones anteriores de Claude. Para obtener un comportamiento amenazante de Claude Opus 4, Anthrope diseñó un escenario para hacer que las amenazas sean un último recurso.


Source link

Follow on Google News Follow on Flipboard
Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Copy Link
Previous ArticleEl Departamento de Educación está investigando hospitalizaciones en Thomas Jefferson High en Virginia
Next Article La Corte Suprema de los Estados Unidos llega a un punto muerto en caso de escuelas religiosas con fondos públicos | Noticias de la corte
corp@blsindustriaytecnologia.com
  • Website

Related Posts

Los abogados podrían enfrentar sanciones «severas» por las citas generadas por la IA falsa, los tribunales del Reino Unido advierten

junio 7, 2025

Semana de revisión: por qué el acceso de la humanidad a Windsurf

junio 7, 2025

¿Musk vs. Trump afectará la transacción de deuda de $ 5 mil millones de Xai?

junio 7, 2025
Add A Comment
Leave A Reply Cancel Reply

el último

Las extensiones de navegador malicioso infectarán a 722 usuarios en América Latina desde principios de 2025

Los funcionarios de Trump prometen levantar las órdenes de separación escolar

Los abogados podrían enfrentar sanciones «severas» por las citas generadas por la IA falsa, los tribunales del Reino Unido advierten

Semana de revisión: por qué el acceso de la humanidad a Windsurf

Publicaciones de tendencia

«Lo vemos casi en todas partes» – ¿Covid está de regreso?

junio 6, 2025

George P. Johnson fortalece la alineación global con los nombramientos de liderazgo estratégico

junio 6, 2025

Las 5 principales historias de la semana de la semana

junio 6, 2025

Suscríbete a las noticias

Suscríbete a nuestro boletín informativo y no te pierdas nuestras últimas noticias.

Suscríbete a mi boletín informativo para recibir nuevas publicaciones y consejos. ¡Manténgase al día!

Noticias Fyself es un medio digital dedicado a brindar información actualizada, precisa y relevante sobre los temas que están moldeando el futuro: economía, tecnología, startups, invenciones, sostenibilidad y fintech.

el último

Las 10 principales nuevas empresas y noticias de financiación tecnológica para los extremos semanales el 6 de junio de 2025

El Auge de las Salidas a Bolsa Cripto Comienza: Gracias a la Espectacular OPI de Circle

Pedido OpenAI para mantener todos los registros de chatgpt, incluidos chats temporales eliminados, solicitudes de API

Facebook X (Twitter) Instagram Pinterest YouTube
  • Home
  • Contáctenos
  • DMCA
  • Política de Privacidad
  • Sobre Nosotros
  • Términos y Condiciones
  • 📢 Anúnciate con Nosotros
  • Enviar publicaciones
© 2025 noticias.fyself. Designed by noticias.fyself.

Escribe arriba y pulsa Enter para buscar. Pulsa Esc para cancelar.