2014-03-07 digital life Identifizierung doppelt! In einer vernetzten Welt wird die Identifizierung von Entitaeten immer wichtiger, denn sie ist die Grundlage der Links und damit der Vernetzung. Die zentrale Anforderung an die Identifikation ist ihre Eindeu- tigkeit. Das Zielobjekt muss eindeutig bestimmbar sein. Daneben ist es wichtig, dass Identifikatoren lange, am besten fuer immer, realistischerweise aber ein Zeitalter lang, gueltig sind. Und schliesslich sollen sich die Identifikatoren auch noch maschinell aufloesen lassen. D.h., die beschriebene Entitaet sollte ohne menschliche Hilfe, von Computern, bestimmt werden koennen, und das natuerlich moeglichst einfach und effizient. Frueher, weit vor der Informationstechnologie, wurden Entitaeten schlicht beschrieben. Bei Buechern waren das z.B. Titel, Ver- fasser, Auflage, Jahr, Verlag und Verlagsort. In den Zeiten der IT kam die ISBN auf, die die maschinelle, eindeutige Zuordnung enorm vereinfacht. Die woertliche Beschreibung und die zugeordnete Nummer sind einander gleichwertig. Beides ist ein ein vollstaendiger Identif- ikator fuer das Werk. Beides bietet aber je andere Vorteile: Die Beschreibung ist menschenverstaendlich und wird sich nicht aen- dern. Dafuer ist sie nicht zwangslaeufig exakt und damit schlecht maschinell aufloesbar. Zudem ist sie lang. Die Nummer dagegen ist kurz, exakt und damit einfach aufloesbar. Sie hat aber keine erk- ennbare Aussage ueber den Inhalt. Auch wird sie kaum laenger als ein Technologiezeitalter bestehen bleiben, wenn sie ueberhaupt eine Dauerhaftigkeit besitzt. Meine These ist, dass zur Identifizierung von Entitaeten die Kom- bination beider Konzepte am sinnvollsten ist und dass man auf keines verzichten sollte, wenn das auch Redundanz bedeutet. Schauen wir uns die Welt an: Bestellkataloge haben Artikel- bezeichnungen und Artikelnummern. Man gibt (oder ``gab'', in Zeiten vor den Webshops) auf dem Bestellschein immer beides an. Speisekarten haben neben den Namen der Gerichte oft auch zugeord- nete Nummern aufgedruckt. Bankkonten werden sowohl durch die Kon- tonummer und BLZ (Jetzt IBAN. Juhu!), als auch durch den Inhaber und den Namen des Kreditinstituts angegeben. Server im Internet koennen ueber Domainnamen und ueber IP-Adressen angesprochen wer- den. Websites haben Titel und URLs. Emails haben From-, To-, Subject- und Date-Header aber auch Message-IDs. Ueberall ist eine Kombination von Beschreibung und Nummerierung vorhanden. Jede Form hat ihre Vor- und Nachteile; keine kann die andere ganz ersetzen. Ich glaube deshalb, dass nur die Kombina- tion aus beiden Identifizierungssystemen alle Anforderungen der gewuenschten Ziele erreicht. Es sollten demnach nicht nur ISBNs oder nur URLs angegeben werden, sondern stets auch die beschreibenden Metadaten dazu. Die wichtigere Komponente ist aber diese Beschreibung, denn sie uebersteht Technologiezeitalter. Sie ist dauerhafter und kann notfalls von Menschen wieder ein eine (andere) Nummernform gebracht werden. Umgekehrt ist das nur kurzfristig moeglich. Der Wunsch *persistente* Nummern-IDs zu erzeugen, wie das z.B. ISBNs und DOIs versuchen, ist nett, kommt aber letztlich nicht an die Qualitaeten der woertlichen Beschreibung heran. (Wobei diese wiederum das Problem der Abhaengigkeit von einer konkreten Sprache haben.) Ein interessanter Fall sind noch die URNs, die versuchen beide Welten zu vereinen. Sie sollen eindeutig maschinell aufloesbar sein und doch lesbar und beschreibend. (Da sind wir bei Boris' allgemeiner Sichtweise auf URIs.) Teilweise erfuellen sie dieses Ziel, teilweise kranken sie aber auch an dem Wunsch zwei unter- schiedliche Konzepte vereinen zu wollen. Ich glaube, es waere besser zu aktzeptieren, dass die explizite Kombination aus einer woertlichen Beschreibung und einer oder mehrerer ``Nummern'' die maechtigste Identifizierung ist. Die Frage ist nur, wieviel Energie und Platz man verschwenden will um eine Entitaet zu identifizieren. Die Antwort wird je nach Fall unterschiedlich ausfallen. Was laesst man dann weg? Hier mag nun letztlich die URN mit ihrem Nichts-Halbes-und-nichts-Ganzes- Charakter doch noch eine gute Wahl sein. http://marmaro.de/apov/ markus schnalke