Linie
Speziell bei quantitativen Merkmalen mit vielen unterschiedlichen Merkmalsausprägungen bewirkt die Klassierung eine Übersicht verschaffende Verdichtung der Daten. Die Klassierung geschieht i.d.R. durch rechtsoffene Intervalle ki:

\(k_i = [x_i,x_j[ , ~\left(~i\lt~j\right)\)

Alle Merkmalsausprägungen, deren Werte innerhalb eines Intervalls ki liegen, gehören damit zur Klasse ki. Am linken und rechten Rand der Skala kann das Intervall unendlich groß sein:

\(k_0 = ] -\infty,x_1] , k_s = [x_s, \infty[\)


Der Wert \(d_i = x_j-x_i \) heißt Klassenbreite.

Hierbei sollte die Klassenbreite so gewählt werden, dass die Daten hinreichend informativ dargestellt werden können. Es sollte z.B. darauf geachtet werden, dass die einzelnen Werte innerhalb einer Klasse gleichmäßig verteilt sind und sich nicht an einer Klassengrenze häufen.

Möchte man bei ordinal skalierten Merkmalen eine Klassenbildung anwenden, muss man beachten, dass die Klassenbreiten nicht zwingend inhaltlich interpretierbar sind.


Linie