Hallo zusammen,
ich habe folgendes Problem:
ich habe riesige Datenmenge Wetterdaten (pro File 50MB, 650.000 Zeilen) die ich analysieren will.
Die Tabelle ist folgendermaßen aufgebaut:
A: Datum & Uhrzeit
B: Breitengrad
C: Längengrad
D: Windgeschwindigkeit
E: Wellenhöhe
F: Seegang
Die Daten sind aktuell chronologisch geordnet. Für jede Koordinate liegen zu verschiedenen Uhrzeiten Messdaten vor.
Die Breitengrade und Längengrade decken einen Bereich ab.
Es liegen für die Breitengrade und Längengrade jeweils 1000 verschiedene Werte vor.
Mein Ziel ist es die Mittelwerte der Windgeschwindigkeit (ggfs. auch Wellenhöhe und Seegang) pro Koordinaten-Paar zu erhalten, um dann die Koordinaten zu clustern, bzw. das gesamte Gebiet in ein Teilgebiet einzuteilen. Ich kann nämlich keine Analyse für jedes einzelne Koordinatenpaar durchführen.
Wären es nicht so viele Daten würde ich folgendermaßen vorgehen:
Verketten von Längengrad und Breitengrad zu einer Zelle für jede mögliche Kombination
Summewenn(Verkettung Längen und Breitengrad;Windgeschwindigkeit) / Anzahlwenn(Verkettung Längen und Breitengrad) für alle einzelnen Paare.
Habt ihr eine Idee, wie ich das für die große Menge an Daten analysieren und zusammenfassen kann.
Als Wunschdarstellung habe ich aktuell eine Heatmap im Kopf. (X= Breitengrad, Y=Längengrad, Farbskala beschreibt durchschnittliche Windgeschwindigkeit)
Vielen Dank für eure Ideen
Viele Grüße
Florian
ich habe folgendes Problem:
ich habe riesige Datenmenge Wetterdaten (pro File 50MB, 650.000 Zeilen) die ich analysieren will.
Die Tabelle ist folgendermaßen aufgebaut:
A: Datum & Uhrzeit
B: Breitengrad
C: Längengrad
D: Windgeschwindigkeit
E: Wellenhöhe
F: Seegang
Die Daten sind aktuell chronologisch geordnet. Für jede Koordinate liegen zu verschiedenen Uhrzeiten Messdaten vor.
Die Breitengrade und Längengrade decken einen Bereich ab.
Es liegen für die Breitengrade und Längengrade jeweils 1000 verschiedene Werte vor.
Mein Ziel ist es die Mittelwerte der Windgeschwindigkeit (ggfs. auch Wellenhöhe und Seegang) pro Koordinaten-Paar zu erhalten, um dann die Koordinaten zu clustern, bzw. das gesamte Gebiet in ein Teilgebiet einzuteilen. Ich kann nämlich keine Analyse für jedes einzelne Koordinatenpaar durchführen.
Wären es nicht so viele Daten würde ich folgendermaßen vorgehen:
Verketten von Längengrad und Breitengrad zu einer Zelle für jede mögliche Kombination
Summewenn(Verkettung Längen und Breitengrad;Windgeschwindigkeit) / Anzahlwenn(Verkettung Längen und Breitengrad) für alle einzelnen Paare.
Habt ihr eine Idee, wie ich das für die große Menge an Daten analysieren und zusammenfassen kann.
Als Wunschdarstellung habe ich aktuell eine Heatmap im Kopf. (X= Breitengrad, Y=Längengrad, Farbskala beschreibt durchschnittliche Windgeschwindigkeit)
Vielen Dank für eure Ideen
Viele Grüße
Florian