Die Wissenschaft hinter Fieldloop

NLP auf Forschungsniveau, eingesetzt für strategische Vertriebsanalyse.

Die Fieldloop-Engine entstand als gemeinsames Projekt von Brighten Digital und der Wirtschaftswissenschaftlichen Fakultät der Mendel-Universität Brünn. Sie ist der analytische Kern, der die redaktionelle Schicht überhaupt vertrauenswürdig macht. Diese Seite fasst zusammen, wie die Engine arbeitet, warum sie so konstruiert wurde, und wo das vollständige begutachtete Paper zu finden ist.

Die Architektur in einem Absatz

Eine BERTopic-Pipeline, abgestimmt auf mehrsprachige CRM-Texte.

Die Engine verarbeitet kurze, freie Textnotizen aus dem CRM in tschechischer, englischer und deutscher Sprache. Personenidentifizierende Daten werden über einen mehrsprachigen NER-Dienst entfernt; der bereinigte Text geht in Transformer-Embeddings, die Dimensionalität wird per UMAP reduziert, thematische Cluster werden mit HDBSCAN identifiziert. Class-based TF-IDF extrahiert repräsentative Keywords, ein LLM weist menschenlesbare Labels und geschäftliche Dimensionen zu, und ein eingebetteter Qdrant-Vektorspeicher hält die Kontinuität über chronologische Releases hinweg. Ergebnis ist eine strukturierte Menge aus Themen, narrativen Verschiebungen und Themenverläufen — das Rohmaterial, aus dem die MediaHouse-Publikationsschicht redaktionelle Beiträge formt.

Datenschutz by Design

Pseudonymisierung vor jedem Modell — durch Architektur, nicht durch Richtlinien.

Datenschutz ist in Fieldloop strukturell verankert. Die Engine ist so gebaut, dass personenbezogene Daten die geschützte Systemgrenze in identifizierbarer Form schlicht nicht verlassen können. So wird das in jeder Pipeline-Stufe durchgesetzt:

3.1Was & wann

Was wann pseudonymisiert wird

Bevor ein Dokument eingebettet, ein Thema geclustert oder ein LLM aufgerufen wird, läuft der Quelltext durch einen mehrsprachigen Named-Entity-Recognition-Dienst. Personen-, Organisations- und Ortsbezüge werden durch Platzhalter wie [PERSON], [ORG], [LOC] ersetzt. Der NER-Dienst ist ein Docker-isolierter Sidecar, der ein Modell für slawische Sprachen und ein englisches Modell kombiniert und durch einen Fallback mit regulären Ausdrücken ergänzt. Der bereinigte Text — und ausschließlich er — fließt im weiteren Verlauf in Embedding, Clustering, Keyword-Extraktion und Label-Generierung ein.

3.2Vektorspeicher

Was im Vektorspeicher liegt

Der eingebettete Qdrant-Vektorspeicher enthält nur den bereinigten, pseudonymisierten Text. Die Originalnamen werden separat gespeichert, außerhalb der analytischen Pipeline, in einem mandantengetrennten Speicher. Die Re-Identifikation — die Zuordnung von [PERSON_xxx] zurück zu einem realen Namen — geschieht ausschließlich bei der finalen Artikelerstellung und ausschließlich in der Umgebung des Mandanten. Kein externer Dienst wird je darum gebeten, diese Zuordnung vorzunehmen.

3.3Externe Modelle

Was zu externen Modellen geht

Externe LLMs — derzeit Anthropic Claude und OpenAI für die Bildgenerierung — erhalten ausschließlich pseudonymisierten Text. Cluster-Labels, Themenbeschreibungen und generierter Artikeltext entstehen aus Text, dessen identifizierende Entitäten bereits ersetzt wurden. Das LLM sieht während der Inferenz nie einen echten Personen-, Konto- oder Ortsnamen. Zu keinem Zeitpunkt erhält ein externer Anbieter genug Daten, um eine Quelle zu re-identifizieren.

3.4Residenz

Datenresidenz und Mandantentrennung

Jeder Fieldloop-Mandant ist auf Speicher- und Verarbeitungsebene isoliert. Mandantendaten vermischen sich weder in geteilten Vektorräumen noch in geteilten Analyseläufen. Die Standard-Deploymenttopologie platziert die Infrastruktur des Mandanten innerhalb des Europäischen Wirtschaftsraums; bei regulatorischer Notwendigkeit (typisch für Pharma in DE, CH, FR) ist die Bereitstellung in einer einzelnen nationalen Jurisdiktion möglich. Externe LLM-Aufrufe erfolgen unter Enterprise-Verträgen, die Retention vertraglich beschränken und die Nutzung der Daten für Modelltraining ausschließen.

3.5Auditierbarkeit

Auditierbarkeit

Jede Stufe der Pipeline erzeugt strukturierten, prüfbaren Output: welche Erwähnungen in einen Cluster-Lauf eingegangen sind, welche Entitäten erkannt und pseudonymisiert wurden, welche in welchem generierten Artikel verwendet wurden. Die Architektur unterstützt die Audit-Trail-Erwartungen GxP-naher Branchen: wer, was, wann, mit welchem Input, mit welchem Output. Logs sind mandantengebunden und werden gemäß der Mandantenpolitik aufbewahrt.

3.6Warum das zählt

Warum das bei redaktioneller KI mehr zählt als bei Dashboards

Ein Dashboard zeigt Zahlen. Eine wöchentliche redaktionelle Publikation zeigt Entscheidungen. Ein Datenschutzfehler in einem Dashboard exponiert ein Diagramm. Ein Datenschutzfehler in einer redaktionellen Publikation exponiert eine namentlich genannte Person in einem Führungsbriefing, das anschließend organisationsweit und gegebenenfalls extern weitergeleitet wird. Diese Asymmetrie der Konsequenz ist der architektonische Grund, weshalb Fieldloop Datenschutz als Konstruktionsentscheidung führt, nicht als Policy-Maßnahme.

3.7Compliance

Compliance-Haltung

Fieldloop ist auf die Europäische Datenschutz-Grundverordnung ausgerichtet, einschließlich sektorspezifischer Anforderungen für Pharma (etwa zur Handhabung von Pharmakovigilanzdaten), Finanzdienstleistungen und Energieinfrastruktur. Die Pipeline unterstützt die unter DSGVO erwarteten Betroffenenrechte — Auskunft, Berichtigung, Einschränkung, Löschung —, die im Originaltextspeicher operieren, nicht in der analytischen Schicht, weil die analytische Schicht keine identifizierenden Informationen enthält. Künftige Verpflichtungen unter dem EU AI Act sind durch dieselben architektonischen Entscheidungen abgedeckt.

Mehrsprachige Verarbeitung

Tschechisch, Englisch und Deutsch — und ein Pfad zu weiteren Sprachen.

Die Engine behandelt mehrsprachigen Betrieb als erstklassige Designanforderung, nicht als Funktion, die nachträglich ergänzt wird. Embeddings stammen aus einem mehrsprachigen Transformer-Modell. NER ist in eine slawische und eine englische Pipeline aufgeteilt, die parallel laufen.

Cluster-Labels werden in einer kanonischen analytischen Sprache erzeugt, damit Märkte vergleichbar bleiben; Quellnotizen bewahren ihre ursprüngliche Sprache für redaktionelle Genauigkeit. Ein neuer Markt erfordert eine Erweiterung der Sprachabdeckung eines einzelnen Subsystems — keine Neufassung der Pipeline.

Kontinuität & narrative Verschiebung

Veränderung verfolgen, nicht nur Erwähnungen klassifizieren.

Die meisten Topic-Modelling-Systeme analysieren jeweils einen Batch. Die Engine von Fieldloop ist darauf ausgelegt, eine chronologische Folge von Releases — Woche für Woche, Monat für Monat — zu verarbeiten und zu erkennen, wann sich etwas verschoben hat. Kontinuitäts-Scores verbinden Themen über Releases hinweg.

Kategorien der narrativen Verschiebung erfassen Volumenanstiege, Volumenrückgänge, Keyword-Drift innerhalb eines stabilen Themas und das Auftauchen genuin neuer Themen. Die redaktionelle Schicht stützt sich stark auf diese Signale, um zu entscheiden, was diese Woche eine Geschichte wert ist und was Hintergrund bleibt.

Schützende Tiefe

Eine ausgereifte Darreichung erhöht den Anspruch an das, was darunter liegt.

Eine wöchentliche redaktionelle Publikation ist schneller zu lesen und leichter umzusetzen als ein analytisches Dashboard. Das ist ihr Zweck. Das ist zugleich ihr Risiko. Eine elegante Erzählung überzeugt stärker als ein rauschendes Diagramm; eine schlecht fundierte Erzählung ist deshalb gefährlicher als ein schlecht fundiertes Diagramm.

Das Forschungsargument hinter Fieldloop besagt: Rigorosität in der Engine — Datenschutzkontrollen, robustes Clustering, nachvollziehbare Linien, Erkennung narrativer Verschiebungen — ist keine optionale Infrastruktur unterhalb der redaktionellen Schicht. Sie ist die schützende Infrastruktur, die eine schnelle redaktionelle Auslieferung kommerziell und ethisch verteidigbar macht.

Who built this

Eine Beratung mit regulatorischen Narben, eine Universität mit methodischer Tiefe.

Brighten Digital · technische Leitung

Eine in Prag ansässige Customer-Experience-Beratung und technische Leitung des Fieldloop-Programms. Wir sind Partner von Salesforce, SAP und Oracle und liefern Digital-Transformation-Projekte für große multinationale Organisationen. Unsere Liefererfahrung konzentriert sich auf regulierte Branchen — Pharma, Energie, Finanzdienstleistungen —, also dort, wo die Lücke zwischen Daten und Entscheidung am größten ist und ihre Konsequenzen am asymmetrischsten.

Mendel-Universität Brünn · Methodik

Über ihre Wirtschaftswissenschaftliche Fakultät liefert sie den methodischen Kern: mehrsprachige NLP, Topic Modelling, datenschutzbewusste Vorverarbeitung und Evaluationsrigorosität.

Beide Seiten haben die Arbeit nicht aneinander übergeben. Sie haben Methode und Anwendung gemeinsam übersetzt, in einer geteilten iterativen Pipeline — ein Arbeitsmuster, das ebenso Gegenstand des Papers ist wie die Architektur selbst.

Das vollständige Paper

From Campus to Company — Collaborative Innovation in the Age of AI

Verfasst von Brighten Digital und der Mendel-Universität Brünn. Vorgestellt auf der IDIMT 2026 — Interdisciplinary Information Management Talks —, abgehalten vom 2. bis 4. September 2026 in Hradec Králové, Tschechische Republik. Wissenschaftlicher Leitautor: Prof. Tomáš Pitner.

Countdown bis zur Präsentation

—

Tage

—

Stunden

—

Minuten

—

Sekunden

…bis das Paper auf der IDIMT 2026 vorgestellt wird. Hinterlassen Sie Ihre E-Mail — wir senden Ihnen das Paper, sobald die Sperrfrist endet.

Eingetragen — wir senden Ihnen das Paper, sobald die Sperrfrist endet.

Ziel: 4. September 2026, 18:00 MESZ (Konferenzende). Wird auf den genauen Vortragsslot präzisiert, sobald Prof. Pitner bestätigt.

Zitierhinweis: Baše R., Cuka O., Skřehota O., Jaroš M., Pitner T., Trenz O. (2026). From Campus to Company — Collaborative Innovation in the Age of AI. IDIMT 2026 Conference Proceedings. DOI: folgt.

Das Paper verortet Fieldloop im breiteren Kontext der angewandten universitär-industriellen Zusammenarbeit in der KI. Es dokumentiert die technische Architektur der Engine, die Rolle der synthetischen Datenvalidierung und die redaktionelle Auslieferschicht — und argumentiert: schützende Tiefe (Datenschutz, Rigorosität, Nachvollziehbarkeit) macht redaktionelle KI bei hoher Geschwindigkeit verteidigbar.

Projektförderung und Zeitlinie

Ein Forschungs- und Entwicklungsprogramm, kofinanziert von der Europäischen Union.

Fieldloop wird seit Mai 2025 aktiv entwickelt. Die zugesagte Gesamtinvestition in das Programm — Engineering, Forschung und Partnerzusammenarbeit — übersteigt 1.000.000 EUR.

Die Arbeit findet im Rahmen des Projekts Fieldloop.ai: Vývoj inteligentní automatizace pro CRM systémy (Fieldloop.ai: Entwicklung intelligenter Automatisierung für CRM-Systeme) statt, Registrierungsnummer CZ.01.01.01/01/24_062/0007568, gefördert im Rahmen des Operationellen Programms Technologien und Anwendungen für Wettbewerbsfähigkeit (OP TAK), verwaltet vom Ministerium für Industrie und Handel der Tschechischen Republik, und kofinanziert von der Europäischen Union.

The programme runs in collaboration with Mendel-Universität Brünn, Wirtschaftswissenschaftliche Fakultät.

Kofinanziert von der Europäischen Union

Projekt: Fieldloop.ai — Entwicklung intelligenter Automatisierung für CRM-Systeme
Reg.-Nr.: CZ.01.01.01/01/24_062/0007568
Operationelles Programm: Technologien und Anwendungen für Wettbewerbsfähigkeit (OP TAK)
Geber: Ministerium für Industrie und Handel der Tschechischen Republik