Moderne Preisgestaltung im Umfeld von Revenue Management
- Von Björn Piepenburg
- Deep Lattice Netz, Klassifizierung, Kreuzentropie, Preissensivität, Revenue Management
Beitrag teilen:
Klassisch werden Angebotspreise für Produkte oder Dienstleistungen auf Basis der entstanden Kosten, beaufschlagt mit einer angestrebten Marge, erhoben. Seit Ende des letzten Jahrhunderts gibt es einen zweiten Ansatz zur Festlegung von Angebotspreisen: Wieviel ist ein Kunde bereit, für ein Produkt oder eine Dienstleistung zu zahlen? Im besten Fall deckt dieser Preis die entstandenen Kosten und enthält zusätzlich die angestrebte Marge. Die treibende Branche bei dieser Entwicklung war der Personentransport im Flugverkehr. Durch die Zunahme sogenannter Billig-Airlines waren die renommierten Fluggesellschaften im Zugzwang und mussten sich einen Ansatz überlegen, um ihre Kosten zu decken und trotzdem konkurrenzfähig gegenüber ihren Mitbewerben zu werden. Die Idee war, dass beispielsweise kurzfristig entschlossene Business-Reisende mehr Geld für ein Ticket bezahlen als beispielsweise Städtereisende mit einem langen Planungshorizont. Diese Idee verbreitet sich heute immer weiter auf unterschiedliche Branchen und Produkte wie Hotelübernachten, Leihwagen und dem Güterverkehr. Die zentrale Frage des Ansatzes ist, wieviel ist ein spezifischer Kunde bzw. eine Kundengruppe bereit ist, für ein Produkt oder eine Dienstleistung zu zahlen.
Gründe für akzeptable Preise sind branchen- und kundenspezifisch sehr unterschiedlich. Im Personenverkehr oder, allgemeiner, in der Tourismusbranche, sind es sicher die Vorlaufzeit der Buchung, Flexibilität, Stornierungsbedingungen, zusätzliche Serviceleistungen wie beispielsweise Verpflegung und weitere Einflüsse. Eine genaue individuelle Annahmewahrscheinlichkeit in Abhängigkeit aller Einflüsse inkl. des Preises lässt sich nicht exakt berechnen. Auch bei einer spezifischen Person kann sich die Gewichtung der Einflüsse zwischen zwei Tagen ändern. Verschlechtert sich beispielsweise die Wetterprognose, verringert sich die Kaufwahrscheinlichkeit für Tickets bei kurzentschlossenen Städtereisenden. Eine Reduzierung des Preises könnte den Einfluss neutralisieren, aber auch ein Upgrade in eine andere Beförderungsklasse oder der Zimmergröße könnten die Entscheidung beeinflussen.
Die Aufgabe eines Data Scientist (m/w/d) ist es, aus historischen Transaktionsdaten individuelle Annahmewahrscheinlichkeiten für einen Kunden oder einer Kundengruppe in Abhängigkeit aller vorhandenen Informationen zu schätzen. Die Annahmewahrscheinlichkeiten in Abhängigkeit des Preises unter Berücksichtigung aller Einflüsse wird als Preissensitivitätskurve bezeichnet. Diese hat im Allgemeinen einen S-förmigen (sigmoiden) Verlauf.
Ein Beispiel für die dargestellte Kurve ist ein Dienstleistungsunternehmen, welches Aufträge an Handwerker vermittelt. Im Fall eines Produktpreises müsste die Kurve gespiegelt werden, so dass geringe Preise zu einer hohen Annahmewahrscheinlichkeit führen und hohe Preise zu einer geringen.
Die Kurve lässt sich durch ein mehrdimensionales (nichtlineares) Regressionsmodell abbilden: man sucht eine Funktion, welche die Einflussmerkmale in Bezug auf die Zielgröße (oder auch in Bezug auf mehrere Zielgrößen) abbildet und dabei die Abweichungen zu der tatsächlich gemessenen Zielgröße minimiert. Dies bezeichnet man als überwachtes Lernen. In unserem Fall wäre die Zielgröße die Annahmewahrscheinlichkeit und die Einflussmerkmale aller Informationen (inkl. des Preises), welche in den Transaktionsdaten und in den Kundendaten zur Verfügung stehen. Es gibt nur ein Problem: die Zielgröße ist unbekannt. Wir haben zwar für jedes Angebot die Information, ob es angenommen wurde oder nicht; wie weit der Angebotspreis aber von der Akzeptanzgrenze des Kunden entfernt lag, ist nicht bekannt. Zur Lösung des Problems wechseln wir die Zielgröße auf das binäre Merkmal Annahme / Ablehnung. Dadurch erhalten wir ein sogenanntes logistisches Regressionsmodell, welches wir trainieren können. Was jetzt aber fehlt, sind die gesuchten Annahmewahrscheinlichkeiten.
Um diese zu erhalten, wechseln wir erneut das Lösungsverfahren. Durch die Verwendung der binären Zielgröße Annahme / Ablehnung können wir anstelle der Regressionskurve auch die Zuordnung eines Datensatzes zu einer der der beiden Klassen Annahme oder Ablehnung modellieren – ein Klassierungsproblem. Ähnlich wie bei der Regression erfolgt die Klassenordnung so, dass die Abweichungen zwischen dem tatsächlichen Annahmeverhalten und dem Modell minimal werden. In der Mathematik gibt es bewährte Maße für den Fehler eines Modells. Das bekannteste ist wohl die Wurzel des mittleren quadratischen Fehlers über alle Datensätze. Mit dem Ziel, dass wir irgendwie eine Wahrscheinlichkeit dafür brauchen, dass eine spezifische Merkmalskombination zu einer Annahme des Angebotes führt, wählen wir stattdessen die Kreuz-Entropie als Fehlermaß. Die Kreuzentropie vergleicht eine empirische mit einer theoretischen Verteilung und gibt als Ergebnis nicht nur die Klassenzuordnung zurück, sondern auch die Wahrscheinlichkeiten dafür, dass eine Merkmalskombination in eine der beiden Klassen gehört. Diese Wahrscheinlichkeit können wir als Annahmewahrscheinlichkeit interpretieren.
Es gibt eine weitere Besonderheit innerhalb unserer Aufgabenstellung: Annahmewahrscheinlichkeiten sollten mit steigenden Preisen bei ansonsten gleichen Merkmalen nicht fallen. Wir benötigen also ein Monotoniekriterium, welches dafür sorgt, dass bei einer Zunahme eines Merkmals auch die Zielgröße zunimmt oder zumindest nicht abnimmt (das gilt ebenso für abnehmende Merkmale).
Ein Verfahren, welches alle genannten Anforderungen erfüllt, ist ein Deep Lattice Netzwerk, welches ich in einem anderen Post in diesem Blog vorstelle. Nach dem Training des Netzes, bei dem für die variablen Parameter des Modells Werte auf Basis von Trainingsdaten geschätzt werden, kann über die vorliegenden Informationen eines aktuellen Angebotes inkl. des angebotenen Preises und inkl. Informationen über den potentiellen Kunden eine Annahmewahrscheinlichkeit geschätzt werden. Variiert man den Preis bei konstanten weiteren Merkmalen wird die Annahmewahrscheinlichkeit zu einer Preissensitivitätskurve erweitert. Ein Beispiel zu Anwendung stelle ich in einem weiteren Post in diesem Blog vor.
Mit der Kurve muss entschieden werden, welche Annahmewahrscheinlichkeit vom anbietenden Unternehmen erwartet wird. Greifen wir dazu erneut das Beispiel des Dienstleistungsunternehmens auf, welches Aufträge an Handwerker vermittelt. Nimmt man beispielsweise eine Annahmewahrscheinlichkeit von 50% an, wird der Handwerker den Auftrag zu 50% übernehmen und zu 50% ablehnen. Will man die Zusagewahrscheinlichkeit erhöhen (z.B. weil es nur wenige Handwerker mit den geforderten Qualifikationen gibt oder weil der Handwerker erfahrungsgemäß die Arbeit in einer sehr hohen Qualität abliefert), muss der Preis und damit die Annahmewahrscheinlichkeit erhöht werden. Auf der anderen Seite kann man Glück haben und der Handwerker ist aktuell schlecht ausgelastet und übernimmt den Auftrag auch bei einem Angebotspreis mit einer 40%-igen Annahmewahrscheinlichkeit. Wir haben es hier also mit einem Optimierungsproblem zu tun, welches wir beispielsweise in einem durch den mFund geförderten Forschungsprojektes mit Ansätzen der künstlichen Intelligenz gelöst haben.