Vortrag: Preis-Monitoring mit Hilfe von Künstlicher Intelligenz

Vortrag: Preis-Monitoring mit Hilfe von Künstlicher Intelligenz

Händler werben traditionell um die Gunst der Kunden, indem sie diese mit ansprechenden Angeboten locken. Jeder kennt die wöchentlich zugestellten Handzettel per Post oder auch elektronisch per App. Die Informationen aus solchen Werbeprospekten können für Analysen in unterschiedlichsten Betrachtungen verwendet werden. Die Firma Markant Services International GmbH nutzt solche Daten, um ihr Produkt, den Markant-Preis-Monitor, anzureichern.

Es wurde ein umfangreicher Bilddatensatz erstellt, der aus den Ausschnitten der einzelnen Produktwerbungen besteht. Dabei treten diverse Eigenschaften im Bilddatensatz auf, wie unterschiedliche Hintergrundfarben, Schriftfarben, -größen und -arten innerhalb einer Anzeige. Das Lesen von Text aus solchen Bildern erfordert den Einsatz der Technologie Optical Character Recognition (OCR), welche bereits vielfältige Informationen aus den Werbeanzeigen extrahieren kann.

Jedoch stoßen herkömmliche OCR-Tools an ihre Grenzen, da sie nicht optimal auf die Vielfalt der Werbeanzeigen verschiedener Händler abgestimmt sind. Hier kommt die neue Technologie der Large Multimodal Models (LMMs) ins Spiel, wie zum Beispiel die Modelle GPT4-Vision von OpenAI oder Gemini von Google. Die Idee ist, diese Modelle für die Extraktion von den Informationen aus den Werbeanzeigen zu nutzen, da sie Zusammenhänge zwischen Bildern und Text verstehen. Dennoch bleibt auch hier eine Vielzahl von Herausforderungen bestehen. Insbesondere sind auch Aspekte wie Performance der Modelle, Kosten für die Nutzung der Modelle sowie der Datenschutz nicht zu vernachlässigen.

 

Bianca Lamm M.Sc., Hochschule Offenburg und Markant Services International GmbH