Das Ziel dieses Projekts ist es, zu evaluieren wie die Asset Allokation von Pensionskassen in Bezug auf Wertentwicklung und gleichzeitige Absicherung des Deckungsgrads mittels Reinforcement Learning optimiert werden kann. Diese Klasse der Algorithmen bildet ein recht neues Teilgebiet der künstlichen Intelligenz und findet bereits in zahlreichen Branchen Anwendung. Im Rahmen des zweijährigen Forschungsprojekts arbeiten Dr. Patrick Walker (Head of Investment Solutions) und Dr. Gianluca De Nard (Head of Quantitative Research) mit Dr. Simon Broda zusammen - einem ausgewiesenen Experten für angewandte Statistik, Machine und Deep Learning vom Institut für Finanzdienstleistungen Zug der Hochschule Luzern.
Üblicherweise werden systematische Anlageentscheidungen in der Asset Allokation und in der Portfoliooptimierung in zwei Schritten getroffen: Zuerst wird die gemeinsame Verteilung der zukünftigen Renditen der Anlageinstrumente geschätzt. Im einfachsten Fall, zurückgehend auf Harry Markowitz (1952), ist dies eine multivariate Normalverteilung, die durch den Erwartungswert und die Kovarianzmatrix bereits vollständig bestimmt ist. Aufgrund dieser geschätzten Verteilung werden in einem zweiten Schritt die optimalen Portfoliogewichte bestimmt. Optimalität bezieht sich hierbei oft auf das sog. Mean-Variance Kriterium, welches auf einen Trade-Off zwischen erwarteter Rendite und tolerierbarem Risiko hinausläuft. Es sind jedoch auch andere Kriterien möglich, z.B. die Minimierung der Schwankungsbreite des Portfolios (Minimum-Variance) oder das Ausbalancieren der Risikobeiträge der einzelnen Anlageinstrumente (Risk Parity).
Der oben beschriebene erste Schritt dieser Vorgehensweise ist in der Praxis mit einigen Problemen behaftet. Insbesondere erfordert er eine Reihe von Annahmen, etwa bezüglich der Verteilungsfamilie der Renditen oder der zeitlichen Entwicklung der Volatilität. Jede Annahme birgt aber das Risiko, dass sie in der Praxis nicht erfüllt ist. Selbst bei Korrektheit der Annahmen kann die Schätzung der Verteilung, konkret etwa der Kovarianzmatrix, problematisch sein, insbesondere wenn das Anlageuniversum gross ist und nur eine begrenze Menge an Daten zu Verfügung stehen. Üblicherweise werden diese Schwachstellen des Mean-Variance Ansatzes durch eine Vielzahl verschiedener Hilfsmittel wie Shrinkage-Schätzer, Regularisierung und ein gut durchdachtes Design der Nebenbedingungen adressiert.
Der neuartige Ansatz dieses Forschungsprojektes ist es hingegen, diesen ersten Schritt der Schätzung der Verteilung vollständig zu umgehen, und die optimalen Portfoliogewichte stattdessen direkt aus den Daten zu lernen. Dies wird möglich durch den Einsatz von maschinellem Lernen, der Basis moderner künstlicher Intelligenz. Wir bedienen uns des sogenannten Deep Reinforcement Learnings - eine revolutionäre Technik, die es KI-Modellen ermöglicht, in anspruchsvollen Spielen wie Go oder Schach übermenschliche Leistungen zu erbringen und vielen Bereichen Anwendungen findet, so z.B. bei der Entwicklung selbstfahrender Autos, von Robotern oder auch bei der Diagnose und Behandlung von Krankheiten. Diese Technologie befähigt unsere Modelle, sich in dynamischen Umgebungen wie dem Finanzmarkt eigenständig zurechtzufinden und kontinuierlich aus ihren Fehlern zu lernen.
Im ersten Teil unseres Forschungsprojekts konzentrieren wir uns auf die optimale Allokation zwischen verschiedenen Anlageklassen mithilfe von liquiden ETFs: Aktien (Vanguard Total Stock Market ETF), Immobilien (Vanguard Real Estate Index ETF), Anleihen (iShares Core U.S. Aggregate Bond ETF), Rohstoffe (Invesco DB Commodity Index ETF), sowie Gold (Spotpreis). Mittels dieser Instrumente wird der Grossteil des Anlageuniversums eines typischen institutionellen Investors repräsentiert. Anlagen in Private Equity oder sonstigen alternativen Anlagen sind nicht berücksichtigt, da hierzu keine ausreichenden Datenreihen verfügbar sind.
Die Ergebnisse unseres neuartigen K.I. Ansatzes sind sehr vielversprechend: In der untersuchten Periode von November 2017 bis August 2023 erzielte unser Modell (OLZ Reinforcement Learning Allokation) eine beeindruckende Gesamtrendite (nach Kosten) von 148.7%, während ein gleichgewichtetes Portfolio der fünf Anlageklassen nur 31.0% erzielte. Ein typisches Pensionskassen-Portfolio (30% Aktien, 30% festverzinsliche Wertpapiere, 30% Immobilien und 10% Rohstoffe) erzielte sogar nur eine kumulierte Rendite von 20.6%. Die Wertentwicklung unserer Strategie, dargestellt in Abbildung 1, übertrifft somit deutlich die beiden Benchmarks.