Arc Raiders: Die ARCs haben mehrere „Gehirne" und jagen dich, weil Embark sie mit Machine Learning in Echtzeit belohnt
Die Technologie hinter den ARC-Feinden
Warum fühlen sich die ARCs in Arc Raiders so unheimlich lebendig an? Warum reagieren sie so dynamisch auf jede Situation? Die Antwort lieferte Martin Singh-Blom, Embarks Machine Learning Research Lead, in einem GDC-Talk diese Woche.
Die Kurzfassung: Die ARCs werden von mehreren neuronalen Netzwerk-„Gehirnen" gesteuert und erhalten in Echtzeit Belohnungen für ihr Verhalten.
Kurz & Knapp
- Mehrere „Gehirne": Jeder ARC wird von verschiedenen spezialisierten neuronalen Netzwerken gesteuert
- Belohnungssystem: ARCs erhalten Punkte für gutes Verhalten (Ziel verfolgen, aufrecht bleiben)
- Bestrafung: Punktabzug für schlechtes Verhalten (zu viel Energie, bizarre Gliedmassenwinkel)
- Animations-Referenz: ARCs werden belohnt, wenn sie vorgegebene Animationen imitieren
- Adaptiv: System funktioniert auch bei Hindernissen, fehlenden Gliedmassen oder Granatenbeschuss
- Skalierbar: Jahre für den ersten ARC, danach schnelle Anwendung auf alle weiteren
„Ich habe selbst laufen gelernt"
In einem alten Entwicklungsvideo, das Singh-Blom während des Talks zeigte, humpelt ein Proto-ARC über ein unebenes Feld. Die Maschine kommentiert trocken:
„I learned how to walk on my own."
In einem späteren Clip, in dem der Bot bereits stabiler läuft, warnt er:
„Payback is coming. Eventually."
Was wie ein Witz klingt, beschreibt präzise, wie das System funktioniert: Die ARCs lernen tatsächlich selbstständig, sich zu bewegen – durch ein Feedback-System, das gute Aktionen belohnt und schlechte bestraft.
Das Belohnungssystem erklärt
Die ARCs in Arc Raiders – insbesondere die mehrbeinigen wie Bastions und Leaper – verdienen „Reward Points" durch verschiedene Aktionen:
Belohnt wird:
- Bewegung zum Ziel – Je näher am Spieler, desto mehr Punkte
- Aufrecht bleiben – Umkippen kostet Punkte
- Orientierung zum Ziel – Den Spieler im Blick behalten
- Animation imitieren – Je näher an der Referenz-Animation, desto besser
Bestraft wird:
- Zu viel Energie verbrauchen – Innerhalb der Spielphysik
- Bizarre Gliedmassenwinkel – Hält sie davon ab, sich unkontrolliert zu bewegen
„Good actions increase the reward value and bad actions decrease it."
Mehrere Gehirne für verschiedene Situationen
Die ARCs nutzen zwar auch traditionelle Behavior Trees (wie in anderen Spielen), werden aber zusätzlich von Machine-Learning-„Gehirnen" gesteuert. Jedes Gehirn ist auf eine bestimmte Aufgabe spezialisiert:
| Gehirn | Aufgabe |
|---|---|
| Patrol Walk Brain | Patrouillen-Bewegung |
| Pursuit Brain | Verfolgung von Spielern |
| Weitere... | Je nach Situation |
Diese Gehirne übernehmen je nach Kontext die Kontrolle. Das Ziel jedes Gehirns: Reward Points verdienen.
Animatoren als Lehrer
Embark hat Animatoren, die Beispiel-Animationen erstellen – wie sich ein ARC in einer perfekten Welt bewegen würde. Aber anstatt die ARCs direkt zu puppenspielen (was in einer dynamischen Sandbox massive Limitationen hätte), dienen diese Animationen als Referenz für das Machine Learning.
Je genauer die ARCs die vorgegebene Animation imitieren, desto mehr Punkte verdienen sie. Das bedeutet:
- Basis-Animationen können an verschiedene Bedingungen angepasst werden
- Dynamische Reaktion auf Hindernisse, Terrain, Beschuss
- Konsistente Bewegung trotz unvorhersehbarer Situationen
Warum fühlen sich die ARCs so bedrohlich an?
Das Ergebnis ist eine Reihe von unheimlich motiviert wirkenden KI-Entitäten, die:
- Unvorhersehbare Situationen überwinden – Trümmer, steile Winkel, Granatenbeschuss
- Mit fehlenden Gliedmassen weiterkämpfen – Das System adaptiert
- Dich aktiv verfolgen – Weil sie dafür belohnt werden
Dieses Gefühl, dass die ARCs dich wirklich wollen, kommt direkt aus dem Belohnungssystem: Sie existieren, um belohnt zu werden, und du bist die Belohnung.
Jahre für den ersten, Wochen für den Rest
Singh-Blom erklärte, dass es Jahre dauerte, einen einzelnen ARC zum Laufen zu bringen – wortwörtlich. Aber sobald das System stand, konnte Embark es relativ schnell auf die gesamte ARC-Flotte anwenden.
Das erklärt auch die Vielfalt der ARCs im Spiel: Von den kleinen Pops bis zu den massiven Bastions nutzen alle dieselbe Grundtechnologie, angepasst an ihre spezifischen Körper und Verhaltensweisen.
Die Zukunft: Noch smartere ARCs
Singh-Blom deutete an, dass es noch viel Raum für Verbesserungen gibt. Das könnte bedeuten:
- Zukünftige ARCs werden signifikant intelligenter
- Bestehende ARCs könnten durch Updates verbessert werden
- Neue Verhaltensweisen sind mit dem System leicht implementierbar
Für Spieler bedeutet das: Die Fireflies und Comets aus dem Shrouded Sky Update sind erst der Anfang. Wenn Embark die Technologie weiterentwickelt, könnten zukünftige ARCs noch bedrohlicher werden.
Kontext: Das „Sozialexperiment"
Der GDC-Talk passt zu Embarks ungewöhnlichem Ansatz bei Arc Raiders. CEO Patrick Söderlund erwähnte kürzlich, dass eine Neurologie-Professorin empfohlen hat, das Spiel wissenschaftlich zu untersuchen. Das verhaltensbasierte Matchmaking und jetzt das Machine-Learning-System der ARCs zeigen: Arc Raiders ist technisch ambitionierter als die meisten Extraction Shooter.
Das Anti-Cheat-System nutzt ebenfalls Machine Learning – Embark setzt die Technologie also sowohl für die Spielerfahrung als auch für die Sicherheit ein.
Keine Verschwörungstheorie
Singh-Blom stellte klar: Die ARCs lernen nicht in Echtzeit von Spielern. Sie werden nicht besser, weil sie euch beobachten. Das Training passierte vor dem Launch, und die „Gehirne" sind fertig trainiert.
„That's just us in the way we author them."
Die ARCs fühlen sich schlau an, weil sie gut designed sind – nicht weil sie aktiv von euren Fehlern lernen.
Weitere Arc Raiders News & Guides: