Aprendizaje por defensa reactiva: el nuevo modelo de entrenamiento contra malware

AutorBernal Rojas Villalobos, César Rodríguez Bravo
CargoEspecialista en Ciberseguridad y estudiante de Ingeniería en Ciencia de Datos en Lead University/Profesor de Lead University, Máster en Ciberseguridad e Inventor con más de 100 aplicaciones a patentes en Estados Unidos, Europa y China
Páginas53-67
53
Logos
Enero-Junio 2021
Vol. 2 No. 1
Investigación
ISSN 2215-59 10
Bernal Roja s es especial ista en Ciber seguridad y estudiante de I ngeniería e n Ciencia de Dato s en Lead University y Césa r
Rodríguez es P rofesor de Lead Universit y, Máster en Ciberseguri dad e Inventor con más de 100 aplic aciones a patentes en
Estados Unidos, Europa y China
Bernal Rojas Villalobos
César Rodríguez Bravo
APRENDIZAJE POR DEFENSA
REACTIVA: EL NUEVO
MODELO DE ENTRENAMIENTO
CONTRA MALWARE
RESUMEN
Este artículo propone un nuevo método de defensa en ciberseguridad utilizando inteligencia
articial, que puede ser aplicado en diferentes entornos, desde equipos de escritorio
(personales y empresariales), hasta equipos móviles (tabletas, laptops e incluso celulares).
Los sistemas antimalware o antivi rus tradicionales funcionan de manera determ inística (es
decir, basados en reglas), mientras que los cibercriminales aparecen con técnicas cada
vez más creativas para burlar estos sistemas. En este artículo se propone el diseño de una
arquitectu ra de inteligencia artic ial capaz de detectar un código malicioso mediante
aprendizaje automático, con la capacidad de identicar intentos creativos de burlar los
sistemas de seguridad.
Esta arquitectura se basa en el entrenam iento de dos inteligencias articiales, una maliciosa
o atacante (hacker) y otra defensiva. El entrenamiento de ambos modelos se realiza median-
te aprendizaje por refuerzo con Q-Learni ng y redes neuronales convolucionales, respecti-
vamente. La red neuronal atacante aprenderá mediante aprendizaje por refuerzo a ejecutar
los métodos más utilizados por los hackers para burlar los sistemas antivirus o a ntimalware,
mientras que el modelo defensor hará uso de Deep Learning para convertir los archivos
binarios maliciosos en imágenes, y así poder entrenarse para identicar los patrones del
malware y cualquier otra variante generada por el atacante.
Palabras claves: ciberseguridad, i nteligencia art icial, agentes inteligentes, antivi rus, cap-
tura la bandera.
ABSTRACT
This article proposes a new method of defense in cybers ecurity using arti cial intelligence
that can be applied in various environments, from desktop computers (personal and
business), to mobile computers (tablets, laptops and even cell phones). Traditional anti-
malware or anti-virus systems work determi nistically (based on r ules), while cybercriminals
come up with increasingly creative techniques to bypass these systems. This ar ticle proposes
the design of an artici al intelligence arch itecture capable of detecting malicious code
through machine learning, with the abil ity to identify creative attempts to bypass secur ity
systems.
This architecture is ba sed on the training of two ar ticial intelligences, one malicious or
attacking (hacker) and the other defensive. The training of both models is carried out by
means of reinforcement learning with Q- Learni ng and convolutional neural net works,

Para continuar leyendo

Solicita tu prueba