Gewässeranalytik: Spurenstoff-Tracking mit KI
Kollektive und Künstliche Intelligenz hilft beim Aufspüren von Antibiotika und anderen Spurenstoffen in Gewässern. Das hat das Verbundprojekt K2I am Beispiel von Proben aus der Donau und ihren Zuflüssen in der Region Ulm gezeigt.
Wichtige Ressourcen für Trinkwasser
Oberflächengewässer sind eine wichtige Ressource für unser Trinkwasser. Sie enthalten aber zahlreiche Spurenstoffe, also organische anthropogene Substanzen in einer Konzentration von typischerweise unter einem Mikrogramm pro Liter. Das Spektrum ist riesig. Allein in der Europäischen Chemikalienverordnung sind mehr als 26 000 überwiegend organische Chemikalien registriert, die industriell verwendet werden und in Flüsse, Seen und Meere gelangen können.
Die Oberflächengewässer- und Trinkwasserverordnung sowie andere etablierte Überwachungskonzepte berücksichtigen zwar gängige Pestizide, ebenso einige Substanzen aus der Gruppe der per- und polyfluorierten Alkylsubstanzen (PFAS) sowie viele weitere Schadstoffe, aber sie decken dennoch nur die Spitze des Eisbergs ab. Ein Großteil der künstlich hergestellten chemischen Verbindungen wird aktuell gar nicht überwacht. Daher bleiben die Verursacher und örtlichen Quellen vieler Emissionen unentdeckt. Die unzureichende Erkenntnislage behindert schnelle zielgerichtete Maßnahmen des Umweltschutzes.
Kollektive Nutzung von Daten
Wasserversorger betrifft die Problematik unmittelbar. Sie setzen neben dem Nachweis bekannter Schadstoffe vermehrt auf das Non-Target-Screening (NTS), um eine möglichst weite Palette an organischen Spurenstoffen zu erfassen und auch unbekannte oder nicht erwartete Substanzen im Wasser zu identifizieren. Die Herausforderung liegt dabei in der Auswertung der umfangreichen NTS-Daten. Schon für eine Wasserprobe fallen etwa ein Gigabyte Daten an.
Einige hoch spezialisierte Labore der Wasseranalytik betreiben bereits NTS. Wenn sie ihre Daten im Kollektiv vernetzen, können sie über die zeitlichen sowie räumlichen Informationen und mit Hilfe Künstlicher Intelligenz (KI) den Eintrag und die Verbreitung von Spurenstoffen in Gewässern besser verfolgen. So lassen sich Emissionsquellen bekannter sowie unbekannter Stoffe rasch eingrenzen. Mit diesem Konzept beschäftigte sich das vom Bundesministerium für Bildung und Forschung geförderte Verbundprojekt K2I (www.k2i-tracker.de, Förderkennzeichen 02WDG1593A-D).
Proof-of-Concept mit Donauwasser
Für den Proof-of-Concept wurden in der Modellregion Ulm die Donau und ihre Zuflüsse ein Jahr lang im 15-Tages-Rhythmus an acht Stellen beprobt. Sechs teilnehmende Labore erhielten die Proben zur Analyse. Das NTS erfolgte mit der Kopplung aus Flüssigchromatographie und hochauflösender Massenspektrometrie.
Für die gemeinsame Auswertung der Daten aus den verschiedenen Laboren wurde eine Cloudlösung entwickelt. Die unterschiedlichen NTS-Dateiformate wurden in ein offenes Format konvertiert, über ein vom Münchner Unternehmen Fluxtype entwickeltes Webinterface hochgeladen und mit Metadaten wie den Ortskoordinaten und den Zeitpunkten der Probennahme versehen. Für das Pre-
processing wurden das Peakfinding und andere fundamentale Schritte des NTS-Workflows in einer Pipeline zusammengefasst. Die Integration der Preprocessing-Software übernahm der IT-Dienstleister EnviBee aus Zürich.
Das Postprocessing harmonisierte die Ergebnisse anhand isotopenmarkierter Standards und führte sie laborübergreifend zusammen. Zur Visualisierung der zeitlichen und räumlichen Spurenstoffverläufe wurden Dashboard-Abfragen für die hinterlegte Datenbank generiert.
Neuronales Netz erkennt Anomalien
Zur Bestimmung von Anomalien eignen sich spezielle künstliche neuronale Netze, Autoencoder genannt. Ein Encoder-Decoder-Paar lernt hierbei, Muster in einem reduzierten Darstellungsraum zu verdichten und wesentliche Merkmale zu extrahieren. Aus der komprimierten Darstellung lässt sich ein Bild rekonstruieren, das sich nur über bereits erlernte Muster aufbaut. Beim Abgleich können Differenzen als Anomalien interpretiert werden.
In den NTS-Daten wurden tausende Substanzen gefunden. Aufgrund der demgegenüber relativ geringen Probenzahl konnten viele KI-Methoden allerdings nicht direkt zum Einsatz kommen. Um die Probenzahl zu erhöhen, wurde ein größerer NTS-Datensatz zur Verfügung gestellt, der die Untersuchung von Donau-Proben im Zeitraum 2017 bis 2022 umfasst. Außerdem wurden die Auflösung und damit die Anzahl der detektierten Stoffe durch einen Binning-Ansatz reduziert, der durch spezielle Rechenoperationen eine Aufsummierung der detektierten Stoffe in gröberen Massen- und Retentionszeitfenstern vornahm. Erst so konnte das neuronale Netz effektiv trainiert werden, um Anomalien zu finden.
Das Vorgehen war erfolgreich. Bei einer im April 2021 entnommenen Probe zeigte sich zum Beispiel in einem der markierten Bins eine erhöhte Intensität des Antibiotikums Sulfamethoxazol. Der zeitliche Verlauf mit hohen und kurzzeitigen Spitzen deutete auf eine industrielle Emission hin. Unter Einbezug der Daten aus anderen Laboren konnte die örtliche Verteilung sichtbar gemacht und die Quelle auf einen Donauzufluss eingegrenzt werden. Dies führte schließlich zu einem Emittenten. Auf die Kontamination hingewiesen, stoppte er die Einleitung stark belasteter Prozessabwässer.
Deutschlandweites Anschlussprojekt
Im Rahmen des Verbundprojektes K2I haben IT-Experten und Chemiker gemeinsam einen Demonstrator entwickelt, der NTS-Daten in der Cloud herstellerunabhängig über örtlich verteilte Labore auswertet. Die Wasserversorger Bodenseewasserversorgung, Hamburg Wasser und Hessenwasser sowie die Westfälische Wasser- und Umweltanalytik haben das Projekt mit NTS-Analysen unterstützt. Schon mit den in K2I erhobenen Daten wurden, wie oben am Beispiel der Sulfamethoxazol-Einleitung beschrieben, industrielle Emissionen aufgedeckt und konkrete Maßnahmen für den Gewässerschutz eingeleitet.
Ein ebenfalls deutschlandweites Anschlussprojekt soll die Cloud-Lösung nun weiter forcieren. Unter der Beteiligung von noch mehr Laboren und mit zusätzlichen Analysedaten lassen sich robustere KI-Modelle entwickeln, die weitergehende Aussagen erlauben. Außerdem soll die Standardisierung in der NTS-Analytik vorangetrieben werden, um das Zusammenführen der Daten aus den verschiedenen Laboren und somit die Datenqualität zu verbessern.
Autorinnen und Autoren
Tobias Bader und Rudi Winzenbacher
Landeswasserversorgung, Langenau
Viktoria Pauw und Mohamad Hayek
Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften, Garching
Uwe Müller
DVGW Technologiezentrum Wasser, Karlsruhe
Dieser Beitrag ist zuerst erschienen in analytica pro, dem dem offiziellen Messe-Magazin zur Analytica 2024.
Herausgeber: Gesellschaft Deutscher Chemiker e.V. in Zusammenarbeit mit der Messe München GmbH (Download auf dieser Seite)
Kommentare
Keine Kommentare gefunden!