Die Wissenschaft hinter Fieldloop
NLP auf Forschungsniveau, eingesetzt für strategische Vertriebsanalyse.
Die Fieldloop-Engine entstand als gemeinsames Projekt von Brighten Digital und der Wirtschaftswissenschaftlichen Fakultät der Mendel-Universität Brünn. Sie ist der analytische Kern, der die redaktionelle Schicht überhaupt vertrauenswürdig macht. Diese Seite fasst zusammen, wie die Engine arbeitet, warum sie so konstruiert wurde, und wo das vollständige begutachtete Paper zu finden ist.
Die Architektur in einem Absatz
Eine BERTopic-Pipeline, abgestimmt auf mehrsprachige CRM-Texte.
Die Engine verarbeitet kurze, freie Textnotizen aus dem CRM in tschechischer, englischer und deutscher Sprache. Personenidentifizierende Daten werden über einen mehrsprachigen NER-Dienst entfernt; der bereinigte Text geht in Transformer-Embeddings, die Dimensionalität wird per UMAP reduziert, thematische Cluster werden mit HDBSCAN identifiziert. Class-based TF-IDF extrahiert repräsentative Keywords, ein LLM weist menschenlesbare Labels und geschäftliche Dimensionen zu, und ein eingebetteter Qdrant-Vektorspeicher hält die Kontinuität über chronologische Releases hinweg. Ergebnis ist eine strukturierte Menge aus Themen, narrativen Verschiebungen und Themenverläufen — das Rohmaterial, aus dem die MediaHouse-Publikationsschicht redaktionelle Beiträge formt.
Datenschutz by Design
Pseudonymisierung vor jedem Modell — durch Architektur, nicht durch Richtlinien.
Datenschutz ist in Fieldloop strukturell verankert. Die Engine ist so gebaut, dass personenbezogene Daten die geschützte Systemgrenze in identifizierbarer Form schlicht nicht verlassen können. So wird das in jeder Pipeline-Stufe durchgesetzt:
Was wann pseudonymisiert wird
Bevor ein Dokument eingebettet, ein Thema geclustert oder ein LLM aufgerufen wird, läuft der Quelltext durch einen mehrsprachigen Named-Entity-Recognition-Dienst. Personen-, Organisations- und Ortsbezüge werden durch Platzhalter wie [PERSON], [ORG], [LOC] ersetzt. Der NER-Dienst ist ein Docker-isolierter Sidecar, der ein Modell für slawische Sprachen und ein englisches Modell kombiniert und durch einen Fallback mit regulären Ausdrücken ergänzt. Der bereinigte Text — und ausschließlich er — fließt im weiteren Verlauf in Embedding, Clustering, Keyword-Extraktion und Label-Generierung ein.
Was im Vektorspeicher liegt
Der eingebettete Qdrant-Vektorspeicher enthält nur den bereinigten, pseudonymisierten Text. Die Originalnamen werden separat gespeichert, außerhalb der analytischen Pipeline, in einem mandantengetrennten Speicher. Die Re-Identifikation — die Zuordnung von [PERSON_xxx] zurück zu einem realen Namen — geschieht ausschließlich bei der finalen Artikelerstellung und ausschließlich in der Umgebung des Mandanten. Kein externer Dienst wird je darum gebeten, diese Zuordnung vorzunehmen.
Was zu externen Modellen geht
Externe LLMs — derzeit Anthropic Claude und OpenAI für die Bildgenerierung — erhalten ausschließlich pseudonymisierten Text. Cluster-Labels, Themenbeschreibungen und generierter Artikeltext entstehen aus Text, dessen identifizierende Entitäten bereits ersetzt wurden. Das LLM sieht während der Inferenz nie einen echten Personen-, Konto- oder Ortsnamen. Zu keinem Zeitpunkt erhält ein externer Anbieter genug Daten, um eine Quelle zu re-identifizieren.
Datenresidenz und Mandantentrennung
Jeder Fieldloop-Mandant ist auf Speicher- und Verarbeitungsebene isoliert. Mandantendaten vermischen sich weder in geteilten Vektorräumen noch in geteilten Analyseläufen. Die Standard-Deploymenttopologie platziert die Infrastruktur des Mandanten innerhalb des Europäischen Wirtschaftsraums; bei regulatorischer Notwendigkeit (typisch für Pharma in DE, CH, FR) ist die Bereitstellung in einer einzelnen nationalen Jurisdiktion möglich. Externe LLM-Aufrufe erfolgen unter Enterprise-Verträgen, die Retention vertraglich beschränken und die Nutzung der Daten für Modelltraining ausschließen.
Auditierbarkeit
Jede Stufe der Pipeline erzeugt strukturierten, prüfbaren Output: welche Erwähnungen in einen Cluster-Lauf eingegangen sind, welche Entitäten erkannt und pseudonymisiert wurden, welche in welchem generierten Artikel verwendet wurden. Die Architektur unterstützt die Audit-Trail-Erwartungen GxP-naher Branchen: wer, was, wann, mit welchem Input, mit welchem Output. Logs sind mandantengebunden und werden gemäß der Mandantenpolitik aufbewahrt.
Warum das bei redaktioneller KI mehr zählt als bei Dashboards
Ein Dashboard zeigt Zahlen. Eine wöchentliche redaktionelle Publikation zeigt Entscheidungen. Ein Datenschutzfehler in einem Dashboard exponiert ein Diagramm. Ein Datenschutzfehler in einer redaktionellen Publikation exponiert eine namentlich genannte Person in einem Führungsbriefing, das anschließend organisationsweit und gegebenenfalls extern weitergeleitet wird. Diese Asymmetrie der Konsequenz ist der architektonische Grund, weshalb Fieldloop Datenschutz als Konstruktionsentscheidung führt, nicht als Policy-Maßnahme.
Compliance-Haltung
Fieldloop ist auf die Europäische Datenschutz-Grundverordnung ausgerichtet, einschließlich sektorspezifischer Anforderungen für Pharma (etwa zur Handhabung von Pharmakovigilanzdaten), Finanzdienstleistungen und Energieinfrastruktur. Die Pipeline unterstützt die unter DSGVO erwarteten Betroffenenrechte — Auskunft, Berichtigung, Einschränkung, Löschung —, die im Originaltextspeicher operieren, nicht in der analytischen Schicht, weil die analytische Schicht keine identifizierenden Informationen enthält. Künftige Verpflichtungen unter dem EU AI Act sind durch dieselben architektonischen Entscheidungen abgedeckt.
Mehrsprachige Verarbeitung
Tschechisch, Englisch und Deutsch — und ein Pfad zu weiteren Sprachen.
Die Engine behandelt mehrsprachigen Betrieb als erstklassige Designanforderung, nicht als Funktion, die nachträglich ergänzt wird. Embeddings stammen aus einem mehrsprachigen Transformer-Modell. NER ist in eine slawische und eine englische Pipeline aufgeteilt, die parallel laufen.
Cluster-Labels werden in einer kanonischen analytischen Sprache erzeugt, damit Märkte vergleichbar bleiben; Quellnotizen bewahren ihre ursprüngliche Sprache für redaktionelle Genauigkeit. Ein neuer Markt erfordert eine Erweiterung der Sprachabdeckung eines einzelnen Subsystems — keine Neufassung der Pipeline.
Kontinuität & narrative Verschiebung
Veränderung verfolgen, nicht nur Erwähnungen klassifizieren.
Die meisten Topic-Modelling-Systeme analysieren jeweils einen Batch. Die Engine von Fieldloop ist darauf ausgelegt, eine chronologische Folge von Releases — Woche für Woche, Monat für Monat — zu verarbeiten und zu erkennen, wann sich etwas verschoben hat. Kontinuitäts-Scores verbinden Themen über Releases hinweg.
Kategorien der narrativen Verschiebung erfassen Volumenanstiege, Volumenrückgänge, Keyword-Drift innerhalb eines stabilen Themas und das Auftauchen genuin neuer Themen. Die redaktionelle Schicht stützt sich stark auf diese Signale, um zu entscheiden, was diese Woche eine Geschichte wert ist und was Hintergrund bleibt.
Schützende Tiefe
Eine ausgereifte Darreichung erhöht den Anspruch an das, was darunter liegt.
Eine wöchentliche redaktionelle Publikation ist schneller zu lesen und leichter umzusetzen als ein analytisches Dashboard. Das ist ihr Zweck. Das ist zugleich ihr Risiko. Eine elegante Erzählung überzeugt stärker als ein rauschendes Diagramm; eine schlecht fundierte Erzählung ist deshalb gefährlicher als ein schlecht fundiertes Diagramm.
Das Forschungsargument hinter Fieldloop besagt: Rigorosität in der Engine — Datenschutzkontrollen, robustes Clustering, nachvollziehbare Linien, Erkennung narrativer Verschiebungen — ist keine optionale Infrastruktur unterhalb der redaktionellen Schicht. Sie ist die schützende Infrastruktur, die eine schnelle redaktionelle Auslieferung kommerziell und ethisch verteidigbar macht.
Who built this
Eine Beratung mit regulatorischen Narben, eine Universität mit methodischer Tiefe.
Eine in Prag ansässige Customer-Experience-Beratung und technische Leitung des Fieldloop-Programms. Wir sind Partner von Salesforce, SAP und Oracle und liefern Digital-Transformation-Projekte für große multinationale Organisationen. Unsere Liefererfahrung konzentriert sich auf regulierte Branchen — Pharma, Energie, Finanzdienstleistungen —, also dort, wo die Lücke zwischen Daten und Entscheidung am größten ist und ihre Konsequenzen am asymmetrischsten.
Über ihre Wirtschaftswissenschaftliche Fakultät liefert sie den methodischen Kern: mehrsprachige NLP, Topic Modelling, datenschutzbewusste Vorverarbeitung und Evaluationsrigorosität.
Beide Seiten haben die Arbeit nicht aneinander übergeben. Sie haben Methode und Anwendung gemeinsam übersetzt, in einer geteilten iterativen Pipeline — ein Arbeitsmuster, das ebenso Gegenstand des Papers ist wie die Architektur selbst.
Das vollständige Paper
From Campus to Company — Collaborative Innovation in the Age of AI
Verfasst von Brighten Digital und der Mendel-Universität Brünn. Vorgestellt auf der IDIMT 2026 — Interdisciplinary Information Management Talks —, abgehalten vom 2. bis 4. September 2026 in Hradec Králové, Tschechische Republik. Wissenschaftlicher Leitautor: Prof. Tomáš Pitner.
Countdown bis zur Präsentation
…bis das Paper auf der IDIMT 2026 vorgestellt wird. Hinterlassen Sie Ihre E-Mail — wir senden Ihnen das Paper, sobald die Sperrfrist endet.
Das Paper verortet Fieldloop im breiteren Kontext der angewandten universitär-industriellen Zusammenarbeit in der KI. Es dokumentiert die technische Architektur der Engine, die Rolle der synthetischen Datenvalidierung und die redaktionelle Auslieferschicht — und argumentiert: schützende Tiefe (Datenschutz, Rigorosität, Nachvollziehbarkeit) macht redaktionelle KI bei hoher Geschwindigkeit verteidigbar.
Projektförderung und Zeitlinie
Ein Forschungs- und Entwicklungsprogramm, kofinanziert von der Europäischen Union.
Fieldloop wird seit Mai 2025 aktiv entwickelt. Die zugesagte Gesamtinvestition in das Programm — Engineering, Forschung und Partnerzusammenarbeit — übersteigt 1.000.000 EUR.
Die Arbeit findet im Rahmen des Projekts Fieldloop.ai: Vývoj inteligentní automatizace pro CRM systémy (Fieldloop.ai: Entwicklung intelligenter Automatisierung für CRM-Systeme) statt, Registrierungsnummer CZ.01.01.01/01/24_062/0007568, gefördert im Rahmen des Operationellen Programms Technologien und Anwendungen für Wettbewerbsfähigkeit (OP TAK), verwaltet vom Ministerium für Industrie und Handel der Tschechischen Republik, und kofinanziert von der Europäischen Union.
The programme runs in collaboration with Mendel-Universität Brünn, Wirtschaftswissenschaftliche Fakultät.
Kofinanziert von der Europäischen Union