Sortierung

Nachdem nun MySQL 4.1.11 auf dem Webserver läuft, habe ich bei phpMyAdmin 2.6.3 bei den einzelnen Tabellen entdeckt, dass es eine Spalte "Kollation" gibt. Darin steht überall der Wert "latin1_swedish_ci", was mich doch erstmal verwirrt hatte. Bevor ich den Wert auf einen näherliegenden Wert einstellte, wollte ich erstmal wissen, was es mit diesem Default-Wert auf sich hat.

Dabei habe ich heraus gefunden, dass diese Spalte darüber eine Aussage macht, wie die Wörter sortiert werden sollen. Der voreingestellte Wert "latin1_swedish_ci" besagt zunächst, dass der Zeichensatz "Latin1" verwendet wird. Das "ci" am Ende bedeutet "case insensitive", also dass die Sortierung nicht von der Groß-/Kleinschreibung abhängt. Bei der "swedish"-Sortierung werden deutsche Umlaute (Ä, Ö, Ü) - wie bei MySQL 3.x voreingestellt gewesen - nach dem Buchstaben "Z" einsortiert. Das führte dazu, dass z.B. "Öl" in meiner Produktliste ganz am Ende stand, da ich nach der Spalte Produktname sortiere.

Es gibt als Alternative zu "latin1_swedish_ci" u.a. diese beiden folgenden Werte, wie man für die Spalte Kollation auswählen kann: "latin1_german1_ci" und "latin1_german2_ci". Dabei verwenden beide den Latin1-Zeichensatz und sortieren ohne Rücksicht auf Groß-/Kleinschreibung. Nun wodurch unterscheiden sich "german1" und "german2"?

"latin1_german1_ci": Sortiert nach DIN-1, d.h. die Umlaute werden wie normale Buchstaben ohne Umlaute behandelt, also ä = a, ö = o, ü = u und ß = s. Im Duden und Lexika werden die Wörter so sortiert. Diese Sortierung verwende ich auch auf meiner Einkaufen-Seite für die Produkte. Dadurch ergibt sich folgende Reihenfolge:

"latin1_german2_ci": Sortiert nach DIN-2, besser als Telefonbuch-Sortierung bekannt. Hier werden die Umlaute wie folgt interpretiert: ä = ae, ö = oe, ü = ue und ß = ss. Im Telefonbuch wird diese Sortierung verwendet, damit Müller bei Mueller einsortiert wird. Es ergibt sich mit dieser Sortierung folgende Reihenfolge:

Die Reihenfolge nach "latin1_swedish_ci" wäre:

Hier habe ich einige Quellen / weiterführende Links zu diesem Thema aufgelistet.

Externer Link MySQL Reference Manual über Westeuropäische Zeichensätze Diese Seite ist in Englisch

Externer Link Sortierung von Wortlisten mit Umlauten

Externer Link Sortierung im Duden

zum Anfang

Letzte Änderung: 28.09.2006