KI-Bilderkennung: Erstanalyse des CO2-Fußabdrucks einer Produktionsmaschine
Zielsetzung
Der vorgestellte Demonstrator dient der automatisierten Identifikation und Priorisierung elektrischer Verbraucher in industriellen Schaltplänen sowie der automatischen Abschätzung der anfallenden CO₂-Emissionen. Ziel ist es, Unternehmen dabei zu unterstützen, Energie- und Emissionstransparenz zu schaffen, relevante Messpunkte für den Energieverbrauch zu identifizieren und priorisiert vorzuschlagen, um Energie- und Emissionsreduktionsmaßnahmen gezielter umsetzen zu können.
Methoden
- Convolutional Neural Network (CNN): MobileNet SSD, trainiert auf 135 Elektromotorsymbole.
- Optical Character Recognition (OCR): Tesseract Engine zur Texterkennung und PDF-Textanalyse.
-
Hotspot-Analysen:
- ABC-Analyse: Priorisierung nach Nennleistung und CO₂-Emissionen.
- Energieportfolio: Ergänzt Nutzungsgrad und Nutzungszeit zur differenzierteren Bewertung.
Funktionsweise und Aufbau
Das System kombiniert maschinelles Lernen (Computer Vision, OCR) mit Entscheidungslogik zur Analyse von Schaltplänen. Der Gesamtprozess besteht aus fünf Modulen:
1. Initialisierung & PDF-Konvertierung
- Eingelesene Schaltpläne (PDF oder Bilddateien) werden in ein einheitliches Format (JPEG) konvertiert.
2. Text- und Bildverarbeitung (OCR & CNN)
- Textbasierte Inhalte werden mit Tesseract OCR und PDF-Textanalyse ausgelesen.
- Grafische Symbole (z. B. Elektromotoren) werden durch ein trainiertes CNN erkannt.
- Die Ergebnisse beider Verfahren werden in einer SQL-Datenbank zusammengeführt.
3. Datenverknüpfung & Duplikatfilterung
- Erkannten Symbolen wird technische Information (z. B. Nennleistung, Bezeichnung, Position) zugeordnet.
- Doppelte Funde werden gefiltert und zusammengeführt.
4. Berichtserstellung
- Ein automatisch generierter PDF-Report listet alle identifizierten Verbraucher inklusive Bildausschnitt, Leistungsdaten, Bezeichnung und Seitenverweis.
5. Interaktives Dashboard (Plotly Dash)
- Anzeige der Schaltpläne und Reports sowie einer ABC-Analyse der Verbraucher nach Leistungsanteilen.
- Tabellarische Darstellung der berechneten Emissionen (Emissionsfaktoren aus der ProBas-Datenbank).
- Möglichkeit zur Eingabe von Auslastung und Nutzungsdauer zur Erstellung eines Energieportfolios (4-Klassen-Matrix) und zur Ableitung von Messprioritäten.
Evaluationsergebnisse
- PDF-Text-Erkennung: bis zu 95,8 % (Trainingsdaten)
- CNN-Erkennung: bis zu 73 % (Validierungsdaten, 97 % Confidence Score)