14.05.2020, 08:44
Hallo zusammen,
ich habe einen relativ umfangreichen Datensatz. Dieser beinhaltet Rückmeldungen von Aufträgen mit allen beteiligten Arbeitsplätzen und den jeweiligen Bearbeitungszeiten. Dazu habe ich mir ausgerechnet, ob ein Auftrag an einem Arbeitsplatz rechtzeitig fertig wurde, oder aber verspätet war. Nun möchte ich diese Verspätung in einem Diagramm als Glockenkurve darstellen (z.B. wie Normalverteilung) um eine Aussage über die durchschnittliche Verspätung und die Streuung zu haben. Im Idealfall in Kombination mit einer Pivot-Tabelle, dass ich später einfach nach einzelnen Arbeitsplätzen filtern kann.
Wie genau gehe ich da vor? Welche Daten brauche ich dafür? Ich habe bereits relativ viel experimentiert, leider kam dabei nichts raus.
Bisher sieht mein Ansatz so aus: Ich habe eine Pivot-Tabelle erstellt und habe nun in Spalte A alle Werte der Verspätung, die im Datensatz vorkommen (von -600 bis +150) und in Spalte B die dazugehörige Häufigkeit (also wie oft der entsprechende Wert im Datensatz vorkommt - Größter Teil bei Wert 0). Ich habe dann Mittelwert und Streuung berechnet und versucht, mit der Funktion "NORMVERT" eine Verteilung zu berechnen, was allerdings nicht funktioniert hat, da ich extrem kleine und nahezu identische Werte für den gesamten Datensatz erhalte. Eigentlich ist das ja auch klar, da die Daten ja nicht normalverteilt sind. Muss ich also einfach eine andere Funktion verwenden? Oder muss ich meinen Datansatz transformieren, um normalverteilte Daten zu erhalten? Ich habe genau das mal im Studium in Statistik gelernt, allerdings ist das bereits ein paar Tage her.
Gruß
Tom
ich habe einen relativ umfangreichen Datensatz. Dieser beinhaltet Rückmeldungen von Aufträgen mit allen beteiligten Arbeitsplätzen und den jeweiligen Bearbeitungszeiten. Dazu habe ich mir ausgerechnet, ob ein Auftrag an einem Arbeitsplatz rechtzeitig fertig wurde, oder aber verspätet war. Nun möchte ich diese Verspätung in einem Diagramm als Glockenkurve darstellen (z.B. wie Normalverteilung) um eine Aussage über die durchschnittliche Verspätung und die Streuung zu haben. Im Idealfall in Kombination mit einer Pivot-Tabelle, dass ich später einfach nach einzelnen Arbeitsplätzen filtern kann.
Wie genau gehe ich da vor? Welche Daten brauche ich dafür? Ich habe bereits relativ viel experimentiert, leider kam dabei nichts raus.
Bisher sieht mein Ansatz so aus: Ich habe eine Pivot-Tabelle erstellt und habe nun in Spalte A alle Werte der Verspätung, die im Datensatz vorkommen (von -600 bis +150) und in Spalte B die dazugehörige Häufigkeit (also wie oft der entsprechende Wert im Datensatz vorkommt - Größter Teil bei Wert 0). Ich habe dann Mittelwert und Streuung berechnet und versucht, mit der Funktion "NORMVERT" eine Verteilung zu berechnen, was allerdings nicht funktioniert hat, da ich extrem kleine und nahezu identische Werte für den gesamten Datensatz erhalte. Eigentlich ist das ja auch klar, da die Daten ja nicht normalverteilt sind. Muss ich also einfach eine andere Funktion verwenden? Oder muss ich meinen Datansatz transformieren, um normalverteilte Daten zu erhalten? Ich habe genau das mal im Studium in Statistik gelernt, allerdings ist das bereits ein paar Tage her.
Gruß
Tom