Explainable Automation of Decision-Making in Tax Consulting: Integrating LLMs with Logical Reasoning for the Selection of Transfer Pricing Methods
- Autor
- H. Mörth
- Masterarbeit
- MT2515 (Dezember, 2025)
- Betreut von
- Assoz. Univ.-Prof. Mag. Dr. Christoph Schütz
- Angeleitet von
- FH-Prof. Mag. Dr. Marina Luketina, LL.M.
- Ausgeführt an
- Universität Linz, Institut für Wirtschaftsinformatik - Data & Knowledge Engineering
- Ressourcen
- Kopie
Kurzfassung (Deutsch)
Diese Masterarbeit untersucht, wie die Auswahl von Verrechnungspreismethoden automatisiert werden kann, wenn Geschäftsfälle ausschließlich in unstrukturierter natürlicher Sprache vorliegen. Unter Verrechnungspreise versteht man im internationalen Handel jene Preise, zu dem verbundene Parteien miteinander Geschäfte tätigen. Die Bestimmung der am besten geeigneten Methode basiert auf einer Funktions- und Risikoanalyse in Übereinstimmung mit den Leitlinien der OECD und dem österreichischen Steuerrecht. Die derzeitige Praxis ist sehr manuell, zeitaufwändig und hängt von einem Steuerexperten ab, wobei nur wenig technische Unterstützung oder Digitalisierung vorhanden ist.
Zur Lösung dieses Problems wurde ein Prototyp entwickelt, der Large Language Models zur Faktenerkennung mit einer Prolog-basierten Entscheidungslogik kombiniert. Der Prozess erfolgt mehrstufig: Aus den Fallbeschreibungen in natürlicher Sprache wird zunächst eine Funktions-und Risikoanalyse erstellt, deren Ergebnisse in Prolog-Fakten überführt werden. Diese werden anschließend anhand von Regelwerken für jede OECD-konforme Methode geprüft, wodurch nachvollziehbare und erklärbare Entscheidungen ermöglicht werden. Ein Human-in-the-Loop-Ansatz erlaubt zudem die Validierung oder Korrektur einzelner Fakten durch Experten und steigert damit Robustheit und Verlässlichkeit.
Der Prototyp wurde als Streamlit-Anwendung umgesetzt und anhand von 27 Fällen aus Lehrbüchern und der Praxis evaluiert. Mit einer Gesamtgenauigkeit von 88 % bei der Methodenauswahl konnte die grundsätzliche Machbarkeit nachgewiesen werden. Gleichzeitig zeigten sich wichtige Grenzen: Die Leistung nimmt bei langen oder semantisch komplexen Fallbeschreibungen ab, und die ungleiche Verteilung der Methoden im Datensatz schränkt die Generalisierbarkeit ein.
Die Ergebnisse verdeutlichen, dass hybride Ansätze die erklärbare Entscheidungsunterstützung im Bereich der Verrechnungspreise ermöglichen können, ihre Robustheit und Praxistauglichkeit jedoch von weiterer Verfeinerung, breiteren Datensätzen und einer systematischen Einbindung von Expertenfeedback abhängen.
Kurzfassung (Englisch)
This thesis investigates how the selection of transfer pricing methods can be automated when case descriptions are available only in unstructured natural language. In international commerce transfer prices refer to the price at which related parties transact with each other. The determination of the most appropriate method is based on a Functional and Risk Analysis in line with the OECD Guidelines and Austrian tax law. The current practice is highly manual, time-consuming and dependends on a tax professional with little technical support or digitalisation in place.
To address this problem, a prototype assistance system was developed that combines large language models for natural language understanding of unstructured natural business use cases with a Prolog-based reasoning engine for method selection. The system follows a multi-stage pipeline in which natural language case descriptions are first transformed into a structured Functional and Risk Analysis. This analysis is then converted into Prolog facts. These facts are evaluated against rule bases for each OECD-compliant method, enabling logically grounded and explainable decisions. A human-in-the-loop component allows experts to validate or adjust extracted facts where necessary, thereby enhancing robustness and trustworthiness.
The prototype was implemented as a Streamlit application and evaluated using 27 transfer pricing case descriptions from textbooks and professional practice. Results show that the system achieved an overall accuracy of 88% in selecting the correct transfer pricing method. While this demonstrates the feasibility of combining LLMs with symbolic reasoning, the evaluation also revealed important limitations. On the one hand performance declined in long or semantically complex cases, on the other hand the uneven distribution of methods in the dataset restricted generalizability.
The findings suggest that hybrid approaches can support explainable decision-making in transfer pricing, but their robustness and practical reliability needs further refinement, broader datasets, and systematic integration of expert feedback.