Projekt

Kurzbeschrieb des Projekts


In der von der SUK-P2 geförderten Projektphase 1 des Projekts histHub wird als erstes ein Vornamen-Vokabular mit Hilfe der Daten der beteiligten Projektpartner – der Rechtsquellenstiftung des Schweizerischen Juristenvereins mit der Sammlung Schweizerischer Rechtsquellen (SSRQ), dem Historischen Lexikon der Schweiz (HLS), den Diplomatischen Dokumenten der Schweiz (DDS) und dem Schweizerdeutschen Wörterbuch (Idiotikon) – realisiert.

Beim Vornamen-Vokabular handelt es sich um ein einfaches mehrsprachiges Vokabular (ohne Hierarchien etc.), in dem alle Vornamen der Personen der Projektpartner und ihre historischen oder mundartlichen Schreibvarianten mit Quellen- oder Textstellen belegt sind. In der Regel, ist jeder Vorname einer oder mehreren Personen, die diesen Vornamen tragen, zugeordnet. Es gibt eine Hitliste der häufigsten Vornamen von 200 v. Chr. bis 2016 n. Chr. sowie eine Visualisierung in Wortwolken und der Vorkommen in einer Timeline.

Datengrundlage


Das Ausgangsmaterial waren die Benennungen der Personen der Projektpartner und die daraus gewonnenen Vornamen, inkl. Rückverfolgbarkeit der Herkunft der Daten, Angabe des Geschlechts der Person, Datierung, Sprache etc. Dagegen sind im Idiotikon die Vornamen als solche, unabhängig von Personen, behandelt.

Sammlung Schweizerischer Rechtsquellen (SSRQ)
Liste der Personen der beiden jüngsten Rechtsquellenbände Sarganserland (SSRQ SG III/2) und Entlebuch (SSRQ LU II/3) mit originalsprachlichen Schreibvarianten
Total: 3’013 Personen (Stand: 27.7.2016)

Historisches Lexikon der Schweiz (HLS)
Liste der Personen des HLS ohne Mehrfachnennungen
Total: 25’203 Personen (Stand: 28.7.2016)

Diplomatische Dokumente der Schweiz (DDS)
Liste der Personen der DDS ohne Mehrfachnennungen
Total: 43’830 Personen (Stand: 28.7.2016)

Schweizerdeutsches Wörterbuch (Idiotikon)
Liste der Vornamen des Idiotikons, die bereits im semantischen Register manuell erfasst wurden (ca. 1’300 Vornamen) mit mundartlichen Schreibvarianten
Total: 1’923 Vornamen (Stand: 28.7.2016)

72’046 total importierte Personen-Datensätze und 1’923 total importierte Vornamen-Datensätze

Begriffsklärung


Inhalt des Vornamen-Vokabular (Namensträger)
Im Vornamen-Vokabular finden sich Vornamen, die Personen trugen, die in Quellen, welche die heutige Schweiz betreffen, sowie in den Datensätzen der Projektpartner belegt sind. Es können auch Vornamen von mythischen Figuren vorkommen, z. B. Arnold Winkelried.

Vorname als Vornamensform und als Vornamen-Konzept
Im Vornamen-Vokabular kommen Vornamen mit ihren unterschiedlichen historischen Formen, d. h. Benennungen oder Bezeichnungen, aber auch als Konzepte vor.

Vornamensform
Unter Vornamensformen verstehen wir die historisch belegten Benennungen oder Bezeichnungen von Vornamen in ihren unterschiedlichen Formen, z. B. Taufname, Kosename, Schreibvarianten (siehe unten). Im Vornamen-Vokabular wird zwischen den nach heutigem Sprachgebrauch normalisierten Benennungen der Vornamen (= Hauptformen) aus den beteiligten Projekten, z. B. «Hans», «Hannes», «Jean» oder «Giovanni», und alternativen Vornamensformen (= Schreibvarianten) unterschieden. Beide Kategorien von Benennungen können historisch belegt werden, müssen aber in einer Quelle zur Schweizer Geschichte nicht zwingend vorkommen.
Im Vokabular wird zwischen Vornamen mit einfacher Form, z. B. «Johannes», und mit mehrteiligen Formen, z. B. «Hans Peter», unterschieden. Eine Beziehung zwischen der mehrteiligen Form und ihren Komponenten wird erstellt.

Ziel des Vornamen-Vokabulars ist es, Benennungen in all ihren Formen historisch zu belegen und mit Personen, die mit diesen Vornamen genannt wurden, in Verbindung zu bringen, damit allmählich eine Chronologie und Geographie des Vornamengebrauchs in der mehrsprachigen Schweiz produziert werden kann.

Vornamen-Konzept
Die im Informationssystem vorhandenen Vornamensformen werden anhand der Etymologie, d. h. ihrer Herkunft, durch die Bearbeitenden zu Vornamen-Konzepten zusammengeführt bzw. die verschiedenen Formen werden einem Konzept zugeordnet, z. B. «Johannes», «Hans», «Hannes», «Jean» oder «Giovanni» sind dem Vornamen-Konzept «[Hans]» zugeordnet.
Für jedes Vornamen-Konzept wird ein Standard-Label (= preferred label in SKOS) pro vorhandene Sprache angegeben. Derzeit wird dieses Label automatisch anhand des häufigsten Vorkommens einer Hauptform im Informationssystem generiert (im obigen Beispiel: «[Hans]»). Im weiteren Verlauf des Projektes wird das Standard-Label anhand der Etymologie des Vornamens und unter Mitwirkung der SprachforscherInnen erstellt: im obigen Beispiel wird dann die historische Hauptform «[Johannes]» die im Informationssystem häufigste Form «[Hans]» ersetzen.
Normalisierten Benennungen (= Hauptformen) und alternative Vornamensformen (= Schreibvarianten) sind im Vokabular direkt mit dem Vornamen-Konzept verbunden. Die Varianten können zusätzlich mit der Hauptform in Verbindung gebracht werden. Diese Klassifikation drückt aber keine historische Beziehung aus, sondern eine rein konzeptuelle.

Hauptform
Die nach heutigem Sprachgebrauch normalisierten Benennungen der Vornamen werden als Hauptformen bezeichnet.

Schreibvariante
Als Schreibvariante wird eine alternative Vornamensform, d. h. eine originalsprachliche oder mundartliche Schreibung eines Vornamens, bezeichnet, z. B. die originalsprachliche Schreibung «Hannß» für die Hauptform «Hans».

Koseform
Als Koseform oder Kurzform wird ein Kosename oder eine Verkleinerungsform einer Hauptform bezeichnet, z. B. «Hänsli» für «Hans». Koseformen werden wie Schreibvarianten behandelt.

Abkürzung
Vornamen, die nicht ausgeschrieben, sondern mit einem Punkt abgekürzt sind, werden als Abkürzungen gekennzeichnet, z. B. J. oder Joh.

Unisex-Vornamen, die von Frauen und Männern getragen werden
Unisex-Vornamen sind geschlechtsneutrale Vornamen, die für Frauen und Männer verwendet werden, z. B. «Camille» oder «Alix».


Datenbearbeitung des Vornamen-Vokabulars


Die Datenbearbeitung und Datenkuration im Vornamen-Vokabular sind ein laufender Prozess und in dem Sinne nicht abgeschlossen. Bisher wurden die einfachen Hauptformen bearbeitet, d. h. die Vornamen-Konzepte für die einfachen Hauptformen erstellt und die Schreibvarianten den Hauptformen zugeordnet (Stand: 26. Oktober 2016).

Die Zuordnung der verschiedenen Hauptformen zu einem Konzept erfolgte mit Hilfe von Matching-Algorithmen, so dass gewisse Zuordnungen, z. B. «Johann» zum Konzept «[Hans]», nur noch bestätigt werden müssen.

Unsichere Zuordnungen werden als solche ausdrücklich gekennzeichnet. In der Regel wird bei Unsicherheit auf eine Zuordnung verzichtet.

Zuordnung von Abkürzungen
In der Regel lassen sich Abkürzungen nicht einer Hauptform zuordnen, sondern sie können mit mehreren Hauptformen verbunden sein. Die Behandlung der Abkürzungen ist noch nicht abgeschlossen.

Zuordnung von Hauptformen zu einem Vornamen-Konzept
Verschiedene Hauptformen werden einem Vornamen-Konzept zugeordnet, z. B. «Hannes», «Hans», «Johannes» etc. zum Vornamen-Konzept «[Hans]». Zum Label und Standardlabel eines Vornamen-Konzepts siehe weiter oben.

Verschiedene Hauptformen in verschiedenen Sprachen werden einem einzigen Vornamen-Konzept zugeordnet, z. B. «Jean» oder «Giovanni» zu «[Hans]».

Hauptformen des anderen Geschlechts werden mit Angabe des gender einem Vornamen-Konzept zugeordnet, z. B. «Jeanette» zu «[Hans]».

Bei mehrteiligen Hauptformen wird auf die einfachen Hauptformen, aus denen sie zusammengesetzt sind, verwiesen.


Zuordnung von Schreibvarianten zu Hauptformen
Die originalsprachlichen oder mundartlichen Schreibvarianten werden den Hauptformen zugeordnet. Eine Schreibvariante kann mehreren Hauptformen zugeordnet sein, z. B. «Jos» kann die Kurzform von «Josef» oder «Justus» sein.

Bestimmung der Sprache
Die Zuordnung der Sprache einer Hauptform oder einer Schreibvariante eines Vornamens erfolgt aus dem Textkontext. Z. B. Vornamen und Namen von Personen, die in deutschsprachigen Quellentexten vorkommen, werden mit dem Sprachcode für Deutsch ausgezeichnet.
Zudem werden bei der sprachlichen Zuordnung der Namen der Personen der historische Kontext, d.h. der Geburtsort bzw. das Land, aus dem eine Person stammt, berücksichtigt. So wird z. B. der Vorname von Ivan Franko nicht als deutsch, französisch oder italienisch, sondern als ukrainisch ausgezeichnet, weil er nach dem HLS in der Ukraine geboren wurde.

Eine Hauptform kann je nach Sprache oder Geschlecht unterschiedlich gebraucht werden:
  • Weil sich «fremdsprachige» Vornamen, z. B. der aus dem Italienischen stammende Vorname «Marco» in der Deutschschweiz, einbürgern können, kann eine Hauptform mehrere Sprachzuordnungen haben. Mit Hilfe des Vokabulars ist es möglich, zwischen der «Etymologie» und dem «Gebrauch» eines Vornamens zu unterscheiden.
  • Je nach Geschlecht kann die Sprachzuordnung variieren, z. B. «Andrea» ist im Deutschen ein weiblicher Vorname, im Italienischen ein männlicher Vorname.

Bestimmung des zeitlichen Vorkommens eines Vornamens
Das zeitliche Vorkommen der Vornamen ergibt sich aus den in Quellen oder Texten belegten Lebenszeiten und Erwähnungszeiträume von Personen. Z. B.: Der Vorname «Hans» ist erstmals 1363 und letztmals 1935 belegt. Somit ergibt sich ein zeitliches Vorkommen des Vornamens «Hans» von 1363 bis 1935.

Kalenderwechsel
Die sieben katholischen Orte gingen – mit Ausnahme von Ob- und Nidwalden – am 12./22. Januar 1584 vom alten julianischen zum neuen gregorianischen Kalender über (vgl. den Artikel «Kalender» im HLS). Es ist je nach Region der Schweiz noch zu erforschen, wann der Kalenderwechsel genau stattgefunden hat.
Im histHub-Informationssystem werden die Datierungen vor dem ursprünglichen Kalenderwechsel (4. Oktober 1582) nach dem julianischen Kalender, diejenigen nach dem Kalenderwechsel (15. Oktober 1582) nach dem heutigen gregorianischen Kalender angezeigt.

Daten im Vornamen-Vokabular (Stand: 21.10.2016)


1'226 Vornamen-Konzepte
242 Frauenvornamen
992 Männervornamen
72 Unisex-Vornamen, die von Frauen und Männern getragen werden

5'149 Hauptformen
2'747 einfache Hauptformen
2'402 mehrteilige Hauptformen
956 Mundartliche oder originalsprachliche Schreibvarianten

Projektmitarbeitende


Projektleitung
Dr. Pascale Sutter, SSRQ

Konzeption und Verwaltung des Informationssystems
Dr. habil. Francesco Beretta

Informatik und Entwicklung
Natalia Korchagina M.Sc., SSRQ
Dr. Bernhard Ruef, SSRQ
Jonas Schneider M.A., HLS

Studentische Hilfskraft
Melanie Bösiger


Projektlaufzeit


Phase 1

Projektbeginn: 1. August 2016
Projektende: 31. Dezember 2016




Ein Kooperationsprojekt von

Mandated by