Künstliche Intelligenz

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Version vom 6. Mai 2023, 11:37 Uhr von Hartenthaler (Diskussion • Beiträge) (→‎Einzelnachweis: Link zur Facebook Gruppe ergänzt)
Zur Navigation springen Zur Suche springen

Künstliche Intelligenz[1] kann auf viele verschiedene Arten bei der Ahnen- und Familienforschung genutzt werden. Auf dieser Seite sollen solche Ansätze gesammelt und diskutiert werden.

Anwendungsfelder

Erkennung von Handschriften und alten Dokumenten

Mit einem System wie Transkribus lassen sich alte Texte erkennen und transkribieren. Dadurch entstehen Textdokumente, die das Durchsuchen von historischen Dokumenten möglich machen. Transkribus ist eine KI, die mit sehr vielen alten Texten trainiert worden ist, darunter befinden sich Dokumente mit Deutschen Handschriften (Kurrent, Sütterlin, Fraktur) sowie Schreibschriften und Druckschriften in verschiedenen Sprachen.

Eine ähnliche, wenn auch interne, Anwendung verwendete Ancestry bei der Transkription des US Census von 1950. Innerhalb von nur 9 Tagen wurden die handschriftlichen Dokumente erfasst und über 150 Millionen durchsuchbare Datensätze erzeugt.[2]

FamilySearch nennt auf einer Wiki-Seite, dass sie mit Hilfe von "Computer Aided Indexing" mehr als 34 Millionen Bilder indiziert haben, die zu 174 Millionen Datensätzen führten (Stand 2022).

Bearbeitung von Fotos

Der genealogische Web-Dienst MyHeritage nutzt Künstliche Intelligenz um Bilder zu bearbeiten. So können etwa alte schwarzweiße Fotos nachträglich koloriert werden oder Fotos können in kleine Filme verwandelt werden in denen abgebildete Personen animiert werden. Die AI Time Machine™ ist eine weitere Funktion auf MyHeritage, die Künstliche Intelligenz nutzt, um imaginäre Avatare (Bilder) einer Person zu erstellen, wie diese in verschiedenen Epochen der Geschichte ausgesehen haben könnte. Dazu nutzt sie echte Fotos der Person und verwandelt diese in hyperrealistische Avatare.

Erzeugung von gesprochener Sprache mit einer künstlichen Stimme

Es ist möglich eine Person Texte sprechen zu lassen, die sie nie gesagt hat. Dazu werden aus einer Stimmprobe der Person die charakteristischen Sprachmerkmale des Sprechers ermittelt. Sodann können der Person beliebige Texte in den Mund gelegt werden, die authentisch klingen.

Zuordnung von Angaben in Quellen zu Personen, Daten und Orten

Große Anbieter von Genealogiediensten wie FamilySearch, Ancestry und MyHeritage unterstützen ihre Nutzer bei der Zuordnung von Quellen zu Personen in einem Stammbaum des Nutzers. Ob die dabei verwendeten Programme auf einer KI basieren oder in herkömmlicher Weise algorithmisch programmiert worden sind, ist weitgehend ein jeweiliges Firmengeheimnis.

Auswertung von Texten zur Ermittlung genealogisch relevanter Angaben

Längere Texte, wie Biografien oder Gerichtsprotokolle, enthalten oft auch Informationen, die für eine Genealogie relevant sein können. Diese Daten aus den oft langen Texten zu destillieren, kann sehr mühsam sein. Daher bietet es sich an, die Texte durch eine KI, wie etwa ChatGPT, lesen und auswerten zu lassen. Mit geeigneten "Prompts" lassen sich so Tabellen erzeugen, die alle Personen in einem Text mit den zugehörigen Daten und Ereignissen auflisten.

Erstellung von Büchern

KIs wie etwa ChatGPT können auch dazu verwendet werden, Artikel und auch Bücher zu verfassen. Es ist nicht bekannt, ob solche Dokumente im Bereich der Ahnen- und Familienforschung bereits publiziert worden sind. Es ist auch denkbar Artikel für das GenWiki oder CompGen-Blog-Beiträge von einer KI wie ChatGPT erstellen oder illustrieren zu lassen. Fragen zu Open Access und Urheberrecht sind derzeit noch in Diskussion. Es gibt keine Regeln, ob solche Beiträge einer KI hier im GenWiki speziell gekennzeichnet werden sollen. In der Wikimedia-Gemeinschaft werden derzeit diese Fragen intensiv und kontrovers diskutiert.[3]

Zukünftige Anwendungsfelder

Expertensystem für Fragen zur Ahnen- und Familienforschung

Es ist denkbar, eine KI mit Inhalten etwa aus dem GenWiki oder mit Inhalten aus den CompGen-Datenbanken zu trainieren. Wobei es nicht klar ist, ob das nicht bereits erfolgt ist, da etwa das GenWiki öffentlich zugänglich ist. Zumindest kann ChatGPT schon sehr gut auf "Erkläre mir bitte Ahnenschwund." antworten.

Darüber hinaus könnte man z.B. ein PlugIn zu GOV für ChatGPT entwickeln, so dass diese KI danach bei allen Fragen rings um historische Ortsdaten auf die in GOV gespeicherten Informationen zurückgreifen kann. Einfache Fragen wie "Welche Dörfer sind in Mönchengladbach aufgegangen?" beantwortet ChatGPT schon ganz gut, aber bei komplizierteren Fällen muss diese KI derzeit noch passen.

Natürlichsprachige Schnittstelle zu Ahnendatenbanken

Wenn eine KI auf Grundprinzipien und -begriffe zur Ahnen- und Familienforschung trainiert worden ist, könnte man sie als natürlichsprachige Schnittstelle zu einem privaten oder einem öffentlichen Datenbestand, etwa einem der Weltbäume nutzen. Sie könnte dann etwa folgende Fragen beantworten

  • Wann ist meine Tante Erika geboren?
  • Mit wem war Großonkel Siegfried verheiratet?
  • Welche meiner Cousinen haben in der nächsten Woche Geburtstag?
  • Nenne mir alle Nachkommen von Martin Luther, die in diesem Jahrzehnt in den den USA gestorben sind.

Vorteile

...

Risiken

Genealogie lebt davon, dass alle Aussagen und Schlussfolgerungen durch zuverlässige Quellen belegt sind. Genealogie ohne Quellen ist - wie man so schön sagt - Mythologie. Künstliche Intelligenz kann nun aber Quellen erfinden, die absolut echt aussehen, es aber nicht sind. Bei Text-basierten KIs, wie etwa ChatGPT, spricht man davon, dass die KI halluziniert, wenn sie Angaben oder Quellen einfach erfindet. Das liegt in der Natur dieser Art von KI, da sie kein faktenbasiertes Basiswissen verwendet, sondern nur "wahrscheinliche" Abfolgen von Wörtern und Sätzen erzeugt. Anwendungen, die fotorealistische künstliche Bilder und Filme erzeugen, können eventuell später einmal nicht mehr von tatsächlichen Quellen unterschieden werden. Daher ist eine Kennzeichnung von Inhalten, die von einer KI erzeugt wurden, sehr wichtig.

Was sagt ChatGPT selbst dazu?

Auf die Frage "Wie kann eine KI - wie Du - bei der Ahnen- und Familienforschung helfen?" antwortet ChatGPT am 10.04.2023

Als KI kann ich auf verschiedene Weise bei der Ahnen- und Familienforschung helfen:

  1. Datenanalyse und -verarbeitung: Ich kann große Mengen an Daten schnell und effektiv analysieren und verarbeiten, was bei der Durchführung von Ahnen- und Familienforschung hilfreich sein kann. Ich kann beispielsweise Stammbäume erstellen, Verbindungen zwischen Personen aufdecken und genealogische Daten aus verschiedenen Quellen extrahieren.
  2. Datensuche und -beschaffung: Ich kann bei der Suche nach relevanten genealogischen Daten und Informationen aus verschiedenen Quellen helfen. Ich kann beispielsweise öffentlich zugängliche Datenbanken, Archive und Bibliotheken durchsuchen und die relevanten Informationen für die Forschung zusammentragen.
  3. Unterstützung bei der Entscheidungsfindung: Ich kann bei der Entscheidungsfindung helfen, indem ich verschiedene Szenarien modelliere und visualisiere, um die besten Entscheidungen zu treffen. Ich kann beispielsweise dabei helfen, zu entscheiden, welcher Zweig eines Stammbaums am aussichtsreichsten ist, um weiter zu erforschen.
  4. Automatisierung von Aufgaben: Ich kann viele manuelle Aufgaben automatisieren, was Zeit und Ressourcen spart. Ich kann beispielsweise automatisch Stammbäume erstellen, die Verbindungen zwischen Personen identifizieren und Ahnenlinien verfolgen.

Es ist jedoch wichtig zu beachten, dass eine KI allein nicht in der Lage ist, alle Aspekte der Ahnen- und Familienforschung zu bewältigen. Erfolgreiche Forschung erfordert oft auch menschliche Expertise und Urteilsvermögen, insbesondere wenn es um Interpretation und Analyse von Daten geht. Eine KI kann jedoch eine wertvolle Unterstützung und Ergänzung sein.

Was dabei auffällt: die derzeit wichtigsten Anwendungsfelder (Erkennung von Handschriften und Bildbearbeitung) werden überhaupt nicht genannt, stattdessen werden vier eher generische Antworten erzeugt.

Weitere Informationen

Einzelnachweis