2017-08-01 digital life Identifier #2 Relativitaet Ich habe schon einmal ueber Identifier geschrieben, [0] damals hauptsaechlich ueber die zwei Wege ein Objekt zu finden: (1) eine Art Wegbeschreibung, wie eine URL oder eine Buchreferenz, mit Autor, Titel, Verlag, Erscheinungsjahr, etc., und (2) einen eindeutigen Identifier des Zielobjekts, wie eine UUID oder eine ISBN. Erstere Identifier sind robust weil sie hierarchisch und oftmals sprechend sind. Sie loesen zwar nicht unbedingt exakt auf, aber sie erlauben dafuer eine schrittweise Naeherung. Zweitere Identifier sind direkt und exakt, dafuer muessen sie von der Maschine aufgeloest werden, und geht ein Teil des Identifiers verloren (mehr als die evtl. vorhandene Pruefziffer abdeckt), dann ist der Rest wertlos. Heute habe ich mich mit Rolf ueber URNs und UUIDs unterhalten. Ausgehend von diesem Gespraech will ich einen Aspekt beleuchten: Die Relativitaet und damit die Trunkierbarkeit von Identifiern. UUIDs umfassen eine global flache Liste an Identifiern. Die Laenge der Identifier ist konstant 36 Zeichen und damit aus glo- baler Perspektive kurz. Im Gegenzug umfassen z.B. URIs eine Hierarchie. Aus globaler Sicht sind sie deshalb lang. Anders als UUIDs bieten sie aber die Moeglichkeit einer relativen Adressierung. Dadurch wird der Iden- tifier immer kuerzer, je naeher der eigene Bezugspunkt dem Zielobjekt ist. (Meist ist man dem Ziel nahe, wenn man sich mit ihm beschaeftigt.) Vermutlich alle Identifier, die Menschen nutzen, bieten diese re- lative Adressierung. In umfangreichster Form vielleicht Datum und Uhrzeit. Wer nutzt schon ``2017-08-01 19:25:11+02:00'' wenn ``vor zehn Minuten'' genuegt? Ebenso: Wer schreibt ``file://marmaro.de/var/www/marmaro.de/apov/txt'' wenn ``../txt'' genuegt? Bei UUID-identifizierten Ordnerstrukturen wuerde man aber selbst statt der zwei Zeichen ``..'' (fuer das uebergeord- nete Verzeichnis) die 36-stellige UUID schreiben muessen. Dafuer ist sie aber bei globaler Adressierung auch nur die 36 Zeichen lang, statt der 45 Zeichen in obiger file-URL (was fuer URLs noch wenig ist). UUIDs (hier stellvertretend fuer alle Identifier dieser Art) sind perfekte Identifier fuer die reine Computernutzung im Hier und Jetzt. Menschen sollten aber nicht damit arbeiten muessen, weil selbst bei der intensiven Arbeit im engsten Kontext der Objekte immer noch die (nichtssagende) 36-stellige Zeichenfolge genutzt werden muss -- das ist unmenschlich. Allzu gross sollte auch die Zukunftsperspektive des Identifiers nicht sein, denn wir wissen alle, dass der Festlaengen-Identifier IPv4 erschoepft ist, wohingegen die variabel langen URLs noch immer den Anforderungen gewachsen sind. So komme ich am Ende zum gleichen Ergebnis wie in der Betrachtung vor drei Jahren schon: Wir brauchen beides, nebeneinander und sich ersetzend: Exakte absolute Identifier zum direkten Zugriff und sprechende Wegbeschreibungen, die eine relative Adressierung erlauben und sehr viel robuster sind. [0] http://marmaro.de/apov/txt/2014-03-07_identifizierung.txt http://marmaro.de/apov/ markus schnalke