Varias instancias de ChatGPT trabajan juntas para encontrar y explotar vulnerabilidades de seguridad: los equipos LLM probados por UIUC vencieron a los bots individuales y al software dedicado.

Los equipos de instancias GPT-4 pueden trabajar juntos para identificar y explotar vulnerabilidades de seguridad de día cero de forma autónoma, sin ninguna descripción de la naturaleza de la falla. Este nuevo desarrollo, con un oficial de planificación al mando de un equipo de LLM especializados, funciona más rápido e inteligente que los expertos humanos o el software dedicado.

Investigadores de la Universidad de Illinois en Urbana-Champaign (UIUC) han estado estudiando la capacidad de la IA para piratear vulnerabilidades de seguridad durante meses, publicando por primera vez sobre la capacidad incomparable de ChatGPT para violar vulnerabilidades de seguridad cuando reciben descripciones de la naturaleza de la vulnerabilidad. . Desde entonces, el siguiente paso adelante ha sido la innovación en el sistema de agentes de tareas específicas y planificación jerárquica (HPTSA) de la universidad, que ha permitido que el modelo GPT-4 funcione en equipo para ser más del doble de efectivo.

Un gráfico de Richard Fang, Rohan Bindu, Akul Gupta, Qiusi Zhan, el estudio de Daniel Kang

Diagrama que describe HPTSA, del estudio original de UIUC realizado por Richard Fang, Rohan Bindu, Akul Gupta, Qiusi Zhan y Daniel Kang. (Crédito de la imagen: Richard Fang, Rohan Bindu, Akul Gupta, Qiusi Zhan, Daniel Kang)

Como se señaló en el estudio de junio y en el blog del investigador Daniel Kang, HPTSA utiliza una colección de LLM para resolver problemas con mayores tasas de éxito. Kang describe la necesidad de este sistema: "Si bien los agentes de IA individuales son increíblemente poderosos, están limitados por las capacidades LLM existentes. Por ejemplo, si un agente de IA toma un camino (por ejemplo, tratando de explotar un XSS), es difícil para un Agente de explotación XSS para retroceder e intentar explotar otra vulnerabilidad". Kang continúa: “Además, los LLM funcionan mejor cuando se concentran en una sola tarea. »

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir