Please use this identifier to cite or link to this item: https://hdl.handle.net/11264/1082
Full metadata record
DC FieldValueLanguage
dc.contributor.authorWiebe, Jacob-
dc.contributor.otherRoyal Military College of Canadaen_US
dc.date.accessioned2023-03-30T19:18:16Z-
dc.date.available2023-03-30T19:18:16Z-
dc.date.issued2023-03-30-
dc.identifier.urihttps://hdl.handle.net/11264/1082-
dc.description.abstractRecent advancements in deep learning techniques have opened new possibilities for designing solutions for autonomous cyber operations. Teams of intelligent agents in computer network defence roles may reveal promising avenues to safeguard cyber and kinetic assets. The aim of this thesis is to provide evidence to support or refute the applicability of cooperative MARL to a range of tactical cyber defence tasks. In a simulated game environment, agents are evaluated on their ability to jointly mitigate attacker activity in a host-based defence scenario. The complex and interrelated effects of game design elements on the performance of learning systems are explored. The results demonstrate the adaptability of MARL systems to learn in the context of various game objectives and network sizes while being sufficiently robust to perform in large, dynamic problem spaces.en_US
dc.description.abstractLes récents progrès des techniques d'apprentissage en profondeur ont ouvert de nombreuses nouvelles possibilités dans le domaine des cyber opérations. Des groupes d'agents autonomes et intelligents chargés de défendre un réseau informatique pourraient ouvrir de nouvelles voies pour protéger les actifs cyber et cinétiques. L'objectif de cette thèse est de démontrer l'applicabilité de l'Apprentissage par Renforcement Multi-Agent (ARMA) coopératif à une gamme de tâches tactiques en cyberdéfense. Dans un environnement de jeu simulé, les agents sont évalués selon leur capacité d'atténuer conjointement l'activité des menances provoquées par un attaquant dans un scénario visant la défense de l'hôte. Les effets des différents paramètres du jeu sur la performance des systèmes d'apprentissage sont complexes et interdépendants et seront explorés. Les résultats démontrent l'adaptabilité des systèmes ARMA à apprendre dans un contexte de divers tailles de réseau et d'objectifs de jeu tout en étant suffisamment robustes pour les espaces de problèmes qui soient grands et dynamiques.en_US
dc.language.isoenen_US
dc.subjectAutonomous Cyber Defenceen_US
dc.subjectCooperative Multi-Agent Reinforcement Learningen_US
dc.subjectReinforcement Learningen_US
dc.subjectGame Designen_US
dc.subjectCentralized Training Decentralized Executionen_US
dc.titleLearning Cyber Defence Tactics from Scratch with Cooperative Multi-Agent Reinforcement Learningen_US
dc.title.translatedFormation autonome de tactiques de cyberdéfense à l'aide de l’apprentissage par renforcement multi-agent coopératifen_US
dc.contributor.supervisorAl Mallah, Ranwa-
dc.date.acceptance2023-03-22-
thesis.degree.disciplineElectrical and Computer Engineering/Génie électrique et informatiqueen_US
thesis.degree.nameMASc (Master of Applied Science/Maîtrise ès sciences appliquées)en_US
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat 
Thesis_Final_Wiebe.pdf1.44 MBAdobe PDFView/Open


Items in eSpace are protected by copyright, with all rights reserved, unless otherwise indicated.