Learning Cyber Defence Tactics from Scratch with Cooperative Multi-Agent Reinforcement Learning

Wiebe, Jacob

Please use this identifier to cite or link to this item: https://hdl.handle.net/11264/1082

Full metadata record

DC Field	Value	Language
dc.contributor.author	Wiebe, Jacob	-
dc.contributor.other	Royal Military College of Canada	en_US
dc.date.accessioned	2023-03-30T19:18:16Z	-
dc.date.available	2023-03-30T19:18:16Z	-
dc.date.issued	2023-03-30	-
dc.identifier.uri	https://hdl.handle.net/11264/1082	-
dc.description.abstract	Recent advancements in deep learning techniques have opened new possibilities for designing solutions for autonomous cyber operations. Teams of intelligent agents in computer network defence roles may reveal promising avenues to safeguard cyber and kinetic assets. The aim of this thesis is to provide evidence to support or refute the applicability of cooperative MARL to a range of tactical cyber defence tasks. In a simulated game environment, agents are evaluated on their ability to jointly mitigate attacker activity in a host-based defence scenario. The complex and interrelated effects of game design elements on the performance of learning systems are explored. The results demonstrate the adaptability of MARL systems to learn in the context of various game objectives and network sizes while being sufficiently robust to perform in large, dynamic problem spaces.	en_US
dc.description.abstract	Les récents progrès des techniques d'apprentissage en profondeur ont ouvert de nombreuses nouvelles possibilités dans le domaine des cyber opérations. Des groupes d'agents autonomes et intelligents chargés de défendre un réseau informatique pourraient ouvrir de nouvelles voies pour protéger les actifs cyber et cinétiques. L'objectif de cette thèse est de démontrer l'applicabilité de l'Apprentissage par Renforcement Multi-Agent (ARMA) coopératif à une gamme de tâches tactiques en cyberdéfense. Dans un environnement de jeu simulé, les agents sont évalués selon leur capacité d'atténuer conjointement l'activité des menances provoquées par un attaquant dans un scénario visant la défense de l'hôte. Les effets des différents paramètres du jeu sur la performance des systèmes d'apprentissage sont complexes et interdépendants et seront explorés. Les résultats démontrent l'adaptabilité des systèmes ARMA à apprendre dans un contexte de divers tailles de réseau et d'objectifs de jeu tout en étant suffisamment robustes pour les espaces de problèmes qui soient grands et dynamiques.	en_US
dc.language.iso	en	en_US
dc.subject	Autonomous Cyber Defence	en_US
dc.subject	Cooperative Multi-Agent Reinforcement Learning	en_US
dc.subject	Reinforcement Learning	en_US
dc.subject	Game Design	en_US
dc.subject	Centralized Training Decentralized Execution	en_US
dc.title	Learning Cyber Defence Tactics from Scratch with Cooperative Multi-Agent Reinforcement Learning	en_US
dc.title.translated	Formation autonome de tactiques de cyberdéfense à l'aide de l’apprentissage par renforcement multi-agent coopératif	en_US
dc.contributor.supervisor	Al Mallah, Ranwa	-
dc.date.acceptance	2023-03-22	-
thesis.degree.discipline	Electrical and Computer Engineering/Génie électrique et informatique	en_US
thesis.degree.name	MASc (Master of Applied Science/Maîtrise ès sciences appliquées)	en_US
Appears in Collections:	Theses

Files in This Item:

File	Description	Size	Format
Thesis_Final_Wiebe.pdf		1.44 MB	Adobe PDF	View/Open

Show simple item record

Language selection

Search