Untersuchung von 90% des Datensamples für Kurtosis- und Skewness-Funktion.
#1
Moin Moin,

Ich hoffe ihr hattet ein schönes Weihnachtsfest :)

Ich hab über die Weihnachtsfeiertage ein Problem festgestellt und komme einfach nicht weiter:
Ich würde gerne für eine statistische Auswertung die Funktionen Skewness (Schiefe) und Kurtosis verwenden. Da ich sehr große Datensätze untersuche, die zum Teil extrem hohe Messfehler (rd. 5% aller Werte) aufweisen, werden die Ergebnisse verzerrt dargestellt. Bei dem Mittelwert ist es kein Problem: Hier kann ich die Funktion GESTUTZTMITTEL verwenden und somit die kleinsten und größten Werte der ursprünglichen Datenpunkte automatisch ausschließen.

Ich suche also eine solche Excel-Funktion für die Skewness- und Kurtosis-Funktion bzw. einen Weg mit dem ich die Skewness- und Kurtosis-Funktion benutzen kann, ohne dass die Messfehler der Stichprobe berücksichtigt werden. Es sollen quasi 95% (oder 90%) des Datensamples ausgewertet werden und die kleinsten und größten Randwerte aus der Betrachtung ausgeschlossen werden.

Bis auf händisch löschen, habe ich bisher keinen Weg gefunden. Gibt es eine Lösung für mich?

Würde mich über eine Antwort sehr freuen.

Viele Grüße
Sven
Top
#2
Hallo Sven!
Wenn es qualitativ sein soll (>95% vom Max und <5% vom Min sollen rausfallen):
Deine Werte in Spalte A (mit Überschrift in A1)
In B1: 0
In B2: =WENN(ODER(A2<(MIN(A:A)+5%);A2>MAX(A:A)*95%);0;ZEILE())
Doppelklick auf Ausfüllkästchen in B2 kopiert Formel nach unten.
Daten, Duplikate entfernen, Spalte B

Jetzt hast Du nur noch die "inneren" Werte in der Tabelle.
Die Hilfsspalte B kannst Du jetzt löschen.

Gruß Ralf
Gib einem Mann einen Fisch und du ernährst ihn für einen Tag. 
Lehre einen Mann zu fischen und du ernährst ihn für sein Leben. (Konfuzius)
Top
#3
… und wenn es quantitativ sein soll (Herausnahme der unteren und oberen 5% in Bezug auf die Anzahl):

C
22
Formeln der Tabelle
ZelleFormel
C2=WENN(ODER(A2<KKLEINSTE(A:A;ANZAHL(A:A)/20);A2>KGRÖSSTE(A:A;ANZAHL(A:A)/20));0;ZEILE())

Excel Tabellen im Web darstellen >> Excel Jeanie HTML 4.8

Der Rest wie oben.

Gruß Ralf
Gib einem Mann einen Fisch und du ernährst ihn für einen Tag. 
Lehre einen Mann zu fischen und du ernährst ihn für sein Leben. (Konfuzius)
[-] Folgende(r) 1 Nutzer sagt Danke an RPP63 für diesen Beitrag:
  • Sven07
Top
#4
Wie wäre es die Standardabweichung zu berechnen und alle Meßwerte > 3 sigma auszuschließen?
Top
#5
Vielen Dank für Eure Hilfe!

Die Formel: "=WENN(ODER(A2<(MIN(A:A)+5%);A2>MAX(A:A)*95%);0;ZEILE())" funktioniert bei mir nicht. Da werden bei mir nur die Zeilen gezählt und auch die der Ausreißer, also quasi: 

A2: 3568     B2:2
A3: 0          B3:0
A4: 2321     B4:4
A5: 724500  B5:5
etc.


Die Funktion "=WENN(ODER(A2KGRÖSSTE(A:A;ANZAHL(A:A)/20));0;ZEILE())" zählt zwar bei mir auch die Zeilen, aber die (oberen / unteren) Randwerte werden nicht mitgezählt. So kann ich mit einer zweiten wenn_dann-Funktion die Werte wieder zuordnen und hab nur die inneren Werte. 

Aber ich verstehe nicht ganz diesen Teil der Funktion: "ANZAHL(A:A)/20)"?  Was müsste ich eingeben, wenn ich die unteren und oberen 10% der Stichprobe ausschließen möchte?


Vielen Dank für Eure Hilfe!!!
LG, Sven

P.S.
Ich brauche für meine Analyse im Endeffekt eine Funktion, mit der ich eine zweite Hilfsspalte erstellen kann, bei der nur die bereinigten, inneren Werten angezeigt werden und die Ausreißer (kleinsten/größten 5 bzw. 10%) ausgeschlossen werden.
Top
#6
Hi Sven!


Meine beiden Formeln bewirken folgendes:
1. Sie geben den Ausreißern den Wert 0
2. Die "inneren" Werte erhalten die Zeilennummer, da wird nichts gezählt!
3. In Zeile 1 Spalte B habe ich vorab eine 0 geschrieben.
4. Wenn ich jetzt Duplikate entfernen für Spalte B durchführe, lösche ich blitzschnell alle Ausreißer, denn ab Zeile 2, Spalte B sind alle Nullen automatisch die Ausreißer.
5. Die Hilfsspalte B kann dann gelöscht werden.

Beide Varianten wurden von mir getestet und funktionieren einwandfrei!
Oder kommst Du nicht mit der Funktionalität "Duplikate entfernen" klar?

Zitat:Aber ich verstehe nicht ganz diesen Teil der Funktion: "ANZAHL(A:A)/20)"?  Was müsste ich eingeben, wenn ich die unteren und oberen 10% der Stichprobe ausschließen möchte?
x/20 sind … 5% von x
also wären 10%?
1/10?

Gruß Ralf
Gib einem Mann einen Fisch und du ernährst ihn für einen Tag. 
Lehre einen Mann zu fischen und du ernährst ihn für sein Leben. (Konfuzius)
[-] Folgende(r) 1 Nutzer sagt Danke an RPP63 für diesen Beitrag:
  • Sven07
Top
#7
(29.12.2015, 15:47)RPP63 schrieb: Hi Sven!


Meine beiden Formeln bewirken folgendes:
1. Sie geben den Ausreißern den Wert 0
2. Die "inneren" Werte erhalten die Zeilennummer, da wird nichts gezählt!
3. In Zeile 1 Spalte B habe ich vorab eine 0 geschrieben.
4. Wenn ich jetzt Duplikate entfernen für Spalte B durchführe, lösche ich blitzschnell alle Ausreißer, denn ab Zeile 2, Spalte B sind alle Nullen automatisch die Ausreißer.
5. Die Hilfsspalte B kann dann gelöscht werden.

Beide Varianten wurden von mir getestet und funktionieren einwandfrei!
Oder kommst Du nicht mit der Funktionalität "Duplikate entfernen" klar?

x/20 sind … 5% von x
also wären 10%?
1/10?

Gruß Ralf

Vielen herzlichen Dank, Ralf! 
Hat alles wunderbar geklappt!
Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste