Finden statt suchen – dank ESAL

Mit ESAL die Wertschöpfung steigern

08. Juli 2020, 18:12 Uhr   |  Marc Hoffmann, Senior Consultant Search & Analytics beim Datenmanagement- und -analyse-Experten DTI Schweiz AG


Fortsetzung des Artikels von Teil 1 .

Konzept und Modellierung von ESAL entscheiden über Erfolg

Die digitale Transformation betrifft die Tätigkeit von Unternehmen in fast allen Branchen.
© Adobe Stock © NicoElNino, ID: #235464183

Die digitale Transformation betrifft die Tätigkeit von Unternehmen in fast allen Branchen.

Bei ESAL-Projekten kommt es also maßgeblich auf die Zuordnung der Relevanz von Suchergebnissen, deren Kontextualisierung zu den jeweiligen fachbereichsabhängigen Prozessen sowie die Rechte- und Zugriffsverwaltung an. Es reicht nämlich nicht, einfach ein ESAL-Produkt zu installieren, die Datenspeicher anzuschließen und dann zu schauen, wie es funktioniert. Wichtiger und lange vor der Kaufentscheidung für ein Tool von zentraler Bedeutung ist es, ein ESAL-Konzept zu erstellen und eine Modellierung vorzunehmen, welche Datenquellen wie eingebunden werden, welche Relevanz bestimmte Datenarten und Dateiformate haben und welche Dateien überhaupt für welche Entscheidungsebenen zugänglich sein sollen. In der Praxis zeigt sich auch häufig, dass Unternehmen zwar eine bestimmte Herausforderung wie beispielsweise ein DSGVO-konformes Daten-Handling lösen wollen, aber die gesamte Dimension eines ESAL für ihre Compliance erst im Projektverlauf erkennen.

Es gibt auf dem Markt einige Produkte, auf denen eine ESAL aufgebaut werden kann, die aber unterschiedliche Stärken und Schwächen haben. So zeigt sich typischerweise erst bei der Modellierung und der Konzeption eines ESAL-Projekts, welche Plattform die am besten geeigneten Funktionen bietet, um bestimmte Anforderungen umzusetzen. Zudem sind auch bestehende Tools oder Quellen der Fachabteilungen zu integrieren, für die Konnektoren oder Schnittstellen erst noch programmiert werden müssen. Und ein hochaktueller Aspekt ist, dass oftmals Bestandssysteme bereits in die Cloud verlagert wurden, einige Dateien wie Kundenstammdaten und Verträge aber aus Sicherheitsgründen nur On-Premise gespeichert und verarbeitet werden dürfen. Hier muss die Modellierung auf jeder Ebene der Datennutzung eine Lösung finden, die unterschiedlichen Anforderungen gerecht wird.

Damit Kunden ihre eigenen sensiblen Kundendaten nicht in einer Cloud-Lösung für die Suche aufbereiten lassen müssen, ist in bestimmten Fällen eine On-Premise-ESAL-Lösung, die stationär in eigenen Servern läuft, einer Cloud-Lösung vorzuziehen. Die zu indexierenden Datenquellen werden typischerweise in einem initialen Schritt aufbereitet und indexiert; im Folgenden werden nur noch Aktualisierungen verarbeitet. Je nach Bedarf erfolgt dies einmal täglich oder auch häufiger, abhängig von der benötigten Aktualität oder auch der Datenmenge. Diese Aufgabe übernehmen Konnektoren, die unterschiedlichste Drittsysteme, Datenbanken, Filesystemquellen, aber auch Webinhalte erschließen. Für solche Datenquellen beherrschen Konnektoren die inkrementelle Indexierung, also die automatische Indexierung von Datenänderungen.

Für externe Quellen ist es zudem entscheidend, dass sie über eine offene Architektur und Schnittstellen wie ReST (Representational State Transfer) verfügen. ReST ist eine Schnittstelle für verteilte Systeme, mit der viele Inhalte abgegriffen werden können und die somit eine Machine-to-Machine-Kommunikation unterstützt. Die über die Konnektoren gesammelten Daten bereitet die ESAL vor der Indexierung auf, also bei der Überführung in den Suchindex. Über Filter (Conversion) werden die unterschiedlichen Dateiformate (Word, Excel, PowerPoint, PDF, HTML, RTF, TEXT, ZIP) in ein einheitliches, lesbares Format für den Indexer überführt. Zudem wird über Entity-Extraktionen, Regeln oder Integration externer Systeme versucht, die Daten automatisch um zusätzliche Metadaten anzureichern oder zu klassifizieren.

Bei einigen ESAL werden für die Klassifizierung von Inhalten Künstliche Intelligenz (KI) und Machine Learning (ML) eingesetzt. So lässt sich eine KI dafür trainieren, spezifische Inhaltstypen zu identifizieren, typischerweise für Binärdaten wie beispielsweise Bilder und Videos, die keine „lesbaren“ Informationen enthalten. Für Versicherungen ist es häufig relevant, Bilder auszuwerten und Schadenereignisse analysieren zu lassen. Für die Nutzer ist es zudem häufig hilfreich, wenn ein ESAL bei der Aufbereitung auch Thumbnail-Previews für Dokumente erstellen kann. Bei der Spracherkennung und sprachlichen Aufbereitung der zu indexierenden Inhalte kommen Funktionen wie Tokenisierung, Synonyme, Spell Checking, Lemmatisierung, Phonetic sowie Natural Language Processing (NLP) für die jeweilige Sprache zum Einsatz. Und ist ein Text formal korrekt aufbereitet, muss er natürlich auch klassifiziert werden. Hierfür kommen Techniken wie Entity Extraction, KI oder ML zum Zuge. So werden Inhalte „verstanden“ und mittels der obigen Techniken klassifiziert und mit zusätzlichen Informationen angereichert. Diese Klassifizierung und Anreicherung lässt sich dann sowohl bei der Relevanz für bestimmte Geschäftsprozesse als auch beim Ranking der Suchergebnisse nutzen.

Seite 2 von 3

1. Mit ESAL die Wertschöpfung steigern
2. Konzept und Modellierung von ESAL entscheiden über Erfolg
3. Datenaufbereitung entscheidet über Relevanz und Sicherheit

Auf Facebook teilenAuf Twitter teilenAuf Linkedin teilenVia Mail teilen

Verwandte Artikel

NoName Company