PowerQuery, Datenmodell, Datumstabelle
#1
Hallo,

folgende Auswertung möchte ich mit PowerBi Desktop durchführen und lade über Powerquery drei *.csv Dateien. Hierbei handelt es sich um Zählerstände ab 2005 bis 2021. Für diesen Zeitraum gibt es insgesamt drei *.csv Dateien. Ich bin wie folgt vorgegangen:
1. Ich habe die Dateien über Daten abrufen geladen und transformiert
2. Die drei Dateien habe ich über "Abfragen anfügen" zu einer Gesamtdatei zusammengefügt.
3. Aus dieser Gesamtdatei habe ich eine Kalendertabelle erzeugt, die die Jahre vom ersten bis zum aktuellsten Wert vollständig abdeckt (vom 1.1. bis 31.12.)
4. Die Gesamtdatei habe ich in Beziehung zur Kalendertabelle gebracht (n:1)

Wenn ich nun eine Matrix erstelle, in der die Jahre zeilenweise, die Monate spaltenweise und die Zählerstandsveränderung als Wert ausgewertet werden, funktioniert das nur bei einer der drei Dateien (Datei 1)
Datei 1: deckt den Zeitraum vom Anfang bis 2014 ab
Datei 2: die Zählerstände ab 2015 bis 13.1.2020 (Zählerwechsel)
Datei 3: ab 13.1.2020 bis heute

Die Daten der Dateien 2 und 3 habe ich mittels Android App (Energiesparkonto) erfaßt und als *.csv exportiert. Ich hoffe, die folgenden Bilder machen die Sache verständlicher:

Datenmodell:

Dateien bitte im Forumhochladen: https://www.clever-excel-forum.de/Thread...ng-stellen

Füge ich Werte hinzu, ergibt sich folgendes Bild (Daten nur bis einschl. 2014)

Dateien bitte im Forumhochladen: https://www.clever-excel-forum.de/Thread...ng-stellen

Die drei verwendeten Dateien sind auszugsweise folgende:

Dateien bitte im Forumhochladen: https://www.clever-excel-forum.de/Thread...ng-stellen

Der Aufbau sollte identisch sein.

Wo verbirgt sich das Problem, wie kann ich das Problem eingrenzen?

Vielen Dank für das geduldige Lesen und vielen Dank vorab für jegliche Unterstützung,
Marc
Antworten Top
#2
Zitat:folgende Auswertung möchte ich mit PowerBi Desktop durchführen und lade über Powerquery drei *.csv Dateien


Machxt du dies sinnvollerweise direkt in PowerBI, oder gehst du den Umweg über Excel? Weiterhin, wenn du aus einem (Haupt)-Order importierst, dann ist nur eine Abfrage erforderlich.
Antworten Top
#3
Hallo,

ich möchte die Auswertung in PowerBi machen, allerdings taucht beim Daten abrufen ein Problem auf. Daher habe ich dies Excelforum gewählt, um mein Problem mit PowerQuery zu schildern.

Ich bin etwas weiter mit meinen eigenen Spekulationen zum Problem. Ich vermute, dass die Kalendertabelle ursächlich ist. Die Kalendertabelle erzeuge ich dynamisch, damit nicht zu viele Daten, aber auch nicht zu wenige Daten in der Datumstabelle enthalten sind. Nutze ich diese Tabelle nicht, sehen die Daten sinnvoll aus:
[Bild: p.jpeg?fv_content=true&size_mode=5]

Mit der Kalendertabelle ist die Darstellung fehlerhaft:
[Bild: p.jpeg?fv_content=true&size_mode=5]

Ich werde einen anderen Weg wählen müssen, um eine Kalendertabelle zu erzeugen.
Marc
Antworten Top
#4
Deine Bilder sind, zumindest für mich, nicht anzeigbar. Insofern kann ich auch nich sehen was due für ein Problem hast. Versuche eine Excelmappe hochzuladen, in der das Problem, sowie das Ziel ersichtlich sind.
Antworten Top
#5
Hier nochmal der Versuch die Bilder aus meinen ersten Beitrag als Attachment zur Verfügung zu stellen.

In der Zwischenzeit habe ich eine andere Kalendertabelle erzeugt, mit dem gleichen Ergebnis: Es wird nicht der gesamte Zeitraum dargestellt.

Dank schonmal an dieser Stelle für Hilfe,
Marc


Angehängte Dateien Thumbnail(s)
                       

Antworten Top
#6
Wie erzeugst Du den Kalender, speziell den Zeitpunkt? Da könnte das Problem liegen.
Und Beispieldateien wären hilfreich, pbix Dateien nehme ich auch.
Antworten Top
#7
Hallo,

die Kalendertabelle habe ich anhand der folgenden Beschreibung erzeugt: Link wegen Werbung entfernt

Die Datei kann ich gerne noch Anfang nächster Woche schicken.

Welche Problem vermutest Du mit dem Zeitpunkt (falsches Format o.ä.)?

Die Kalendertabelle enthält für jeden Tag die Uhrzeit 00:00 Uhr. Die auszuwertenden Messwerte haben irgendwelche Uhrzeiten (z.B. 8:36 Uhr). Ich sollte ausprobieren, ob ich das Datum  der Messwerte reduziere auf das Datum ohne Uhrzeit, vielleicht funktioniert die Verknüpfung von Datum und Messdatum besser. Was jedoch aufällig ist, die Daten funktionieren erst ab 2015 nicht  mehr. Eingelesen werden insgesamt drei *.csv Dateien (s. Bild). Die jeweiligen Zeitformate sind zwar identisch aufgebaut, aber wie ich jetzt gesehen habe, liegen ab dem Zeitpunkt, ab dem die Daten nicht in den Auswertungen erscheinen, Uhrzeiten ungleich 00:00. Das wird das Problem sein. Ich werde beim ETL der *.csv Dateien eine Spalte mit Datum Uhrzeit 00:00 erzeugen und berichten, ob dies die Lösung ist.

Vielen Dank und ein schönes Wochenende,
Marc
Antworten Top
#8
Super, soll ich mir jetzt den Kurs anschauen und ggf. auch noch was kaufen ... 
Das ist Werbung für linkedin learning portal
Antworten Top
#9
Hallo Warkings,

der Abschnitt des Kurses ist kostenfrei und sehr hilfreich. 

Ich habe das Problem wie folgt lösen können:
- Meine Messwerte haben auch die Uhrzeit enthalten. Ich habe eine Spalte ergänzt, die nur das Datum enthält
- über diese neue Spalte habe ich die Beziehung zur Kalendertabelle erzeugt -> das funktioniert!

Viele Grüße und vielen Dank,
Marc


Angehängte Dateien Thumbnail(s)
       
Antworten Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste