Wie funktioniert die Gesichtserkennung?

Die meisten Menschen sind mit der Gesichtserkennung für die Verwendung in Instagram-Filtern und Face ID vertraut. Aber diese relativ neue Technologie kann sich ein wenig gruselig anfühlen. Ihr Gesicht ist wie ein Fingerabdruck und die Technologie hinter der Gesichtserkennung ist komplex.

Wie bei jeder neuen Technologie gibt es auch bei der Gesichtserkennung Nachteile. Diese Nachteile werden immer offensichtlicher, wenn das Militär, die Polizei, Werbetreibende, und Deepfake-Ersteller, finden verschlagene neue Wege, um die Vorteile von Gesichtserkennungssoftware zu nutzen.

Heute ist es für die Menschen mehr denn je wichtig zu verstehen, wie die Gesichtserkennung funktioniert. Es ist auch wichtig, die Grenzen der Gesichtserkennung zu kennen und zu wissen, wie sie sich in Zukunft entwickeln wird.

Gesichtserkennung ist überraschend einfach

Bevor Sie sich mit den vielen verschiedenen Medien der Gesichtserkennung befassen, ist es wichtig zu verstehen, wie der Prozess der Gesichtserkennung funktioniert. Hier sind drei Anwendungen für Gesichtserkennungssoftware und eine einfache Erklärung, wie sie Gesichter erkennen oder identifizieren:

Grundlegende Gesichtserkennung: Bei Animoji- und Instagram-Filtern „sucht“ Ihre Telefonkamera nach den bestimmenden Merkmalen eines Gesichts, insbesondere nach Augen, Nase und Mund. Dann verwendet es Algorithmen, um ein Gesicht zu erkennen und zu bestimmen, in welche Richtung es schaut, ob sein Mund geöffnet ist usw. Es ist erwähnenswert, dass dies keine Gesichtserkennung ist, sondern nur Software, die nach Gesichtern sucht.
Face ID und ähnliche Programme: Beim Einrichten von Face ID (oder ähnlichen Programmen) auf Ihrem Telefon nimmt es ein Foto Ihres Gesichts auf und misst den Abstand zwischen Ihren Gesichtszügen. Jedes Mal, wenn Sie Ihr Telefon entsperren, „schaut“ es durch die Kamera, um Ihre Identität zu messen und zu bestätigen.
Identifizieren eines Fremden: Wenn ein Unternehmen ein Gesicht aus Sicherheits-, Werbe- oder Polizeizwecken identifizieren möchte, verwendet es Algorithmen, um dieses Gesicht mit einer umfangreichen Datenbank von Gesichtern zu vergleichen. Dieser Prozess ist fast identisch mit Apples Face ID, jedoch in größerem Umfang. Theoretisch könnte jede Datenbank verwendet werden (ID-Karten, Facebook-Profile), aber eine Datenbank mit klaren, vorab identifizierten Fotos ist ideal.

Okay, kommen wir ins Detail. Da die „grundlegende Gesichtserkennung“ für Instagram-Filter ein so einfaches und harmloses Verfahren ist, konzentrieren wir uns ganz auf die Gesichtserkennung und die vielen verschiedenen Technologien, mit denen ein Gesicht identifiziert werden kann.

  So kombinieren Sie PowerPoint-Präsentationen

Die meisten Gesichtserkennungen basieren auf 2D-Bildern

Wie zu erwarten, basiert die meisten Gesichtserkennungssoftware vollständig auf 2D-Bildern. Dies geschieht jedoch nicht, weil die 2D-Gesichtsbildgebung sehr genau ist, sondern aus Gründen der Bequemlichkeit. Die überwiegende Mehrheit der Kameras macht Fotos ohne jede Tiefe, und öffentliche Fotos, die für Gesichtserkennungsdatenbanken verwendet werden können (z. B. Facebook-Profilbilder), sind alle in 2D.

Warum ist die 2D-Gesichtsbildgebung nicht sehr genau? Nun, weil einem flachen Bild Ihres Gesichts Erkennungsmerkmale wie Tiefe fehlen. Mit einem flachen Bild kann ein Computer unter anderem Ihren Pupillenabstand und die Breite Ihres Mundes messen. Aber es kann nicht die Länge Ihrer Nase oder die Hervorhebung Ihrer Stirn sagen.

Darüber hinaus basiert die 2D-Gesichtsbildgebung auf dem sichtbaren Lichtspektrum. Dies bedeutet, dass 2D-Gesichtsaufnahmen im Dunkeln nicht funktionieren und bei unkonventionellen oder schattigen Lichtverhältnissen unzuverlässig sein können.

Einige dieser Mängel können eindeutig durch die Verwendung von 3D-Gesichtsbildgebung umgangen werden. Aber wie ist das möglich? Benötigen Sie eine spezielle Ausrüstung, um ein Gesicht in 3D zu sehen?

IR-Kameras verleihen Ihrer Identität Tiefe

Während einige Gesichtserkennungsanwendungen ausschließlich auf 2D-Bildern basieren, ist es nicht ungewöhnlich, dass die Gesichtserkennung auch auf 3D-Bildern beruht. Tatsächlich beinhaltet Ihre Erfahrung mit der Gesichtserkennung wahrscheinlich eine Prise 3D.

Dies wird durch eine Technik namens Lidar erreicht, die dem Sonar ähnelt. Im Wesentlichen schießen Gesichtsscanner wie Ihr iPhone eine harmlose IR-Matrix in Ihr Gesicht. Diese Matrix (eine Wand aus Lasern) wird dann von Ihrem Gesicht reflektiert und von einer IR-Kamera (oder ToF-Kamera) Ihres Telefons aufgenommen.

Wo passiert die 3D-Magie? Die IR-Kamera Ihres Telefons misst, wie lange es dauert, bis jedes IR-Licht von Ihrem Gesicht abprallt und zum Telefon zurückkehrt. Natürlich hat das Licht, das von Ihrer Nase reflektiert wird, eine kürzere Reise als das Licht, das von Ihren Ohren reflektiert wird, und die IR-Kamera verwendet diese Informationen, um eine einzigartige Tiefenkarte Ihres Gesichts zu erstellen. In Verbindung mit der einfachen 2D-Bildgebung kann die 3D-Bildgebung die Genauigkeit von Gesichtserkennungssoftware erheblich erhöhen.

Die Lidar-Bildgebung ist ein seltsames Konzept, das schwer zu verstehen sein kann. Wenn es hilft, versuchen Sie sich vorzustellen, dass das IR-Mesh Ihres Telefons (oder eines anderen Gesichtserkennungsgeräts) ein Pinnwand-Spielzeug. Wie bei einem Pinnwand-Spielzeug hinterlässt Ihr Gesicht eine Vertiefung im IR-Netz, in der Ihre Nase merklich tiefer liegt als beispielsweise Ihre Augen.

  Wie schreibe ich verkehrte Buchstaben?

Wärmebildtechnik ermöglicht Gesichtserkennung bei Nacht

Einer der Nachteile der 2D-Gesichtserkennung besteht darin, dass sie auf dem sichtbaren Lichtspektrum beruht. Laienhaft gesprochen funktioniert die grundlegende Gesichtserkennung nicht im Dunkeln. Dies kann jedoch mit einer Wärmebildkamera (ja, wie in Tom Clancy) umgangen werden.

„Moment mal“, könnten Sie sagen, „verläßt sich die Wärmebildtechnik nicht auf IR-Licht?“ Ja tut es. Aber Wärmebildkameras senden keine Strahlen von IR-Licht aus; sie erkennen einfach das IR-Licht, das von Objekten emittiert wird. Warme Objekte emittieren eine Menge IR-Licht, während kalte Objekte eine vernachlässigbare Menge IR-Licht emittieren. Teure Wärmebildkameras können sogar subtile Temperaturunterschiede auf einer Oberfläche erkennen, daher ist die Technologie ideal für die Gesichtserkennung.

Ein Bild des sichtbaren Lichtspektrums, ein Wärmebild und ein zusammengesetztes Wärmebild.

Es gibt a Handvoll verschiedene Möglichkeiten ein Gesicht mit Wärmebild zu identifizieren. Alle diese Techniken sind unglaublich kompliziert, aber sie haben einige grundlegende Ähnlichkeiten, daher werden wir versuchen, die Dinge mit einer Liste einfach zu halten:

Mehrere Fotos sind erforderlich: Eine Wärmebildkamera nimmt mehrere Bilder des Gesichts einer Person auf. Jedes Foto fokussiert auf ein anderes Spektrum von IR-Licht (lange, kurze und mittlere Wellen). Normalerweise liefert das Langwellenspektrum die meisten Gesichtsdetails.
Blutgefäßkarten sind nützlich: Diese IR-Bilder können auch verwendet werden, um die Bildung von Blutgefäßen im Gesicht einer Person zu extrahieren. Es ist gruselig, aber Blutgefäßkarten können wie einzigartige Gesichtsfingerabdrücke verwendet werden. Sie können auch verwendet werden, um den Abstand zwischen Gesichtsorganen zu bestimmen (wenn eine typische Wärmebildaufnahme minderwertige Bilder liefert) oder um blaue Flecken und Narben zu identifizieren.
Das Subjekt kann identifiziert werden: Ein zusammengesetztes Bild (oder ein Datensatz) wird unter Verwendung mehrerer IR-Bilder erstellt. Dieses zusammengesetzte Bild kann dann mit einer Gesichtsdatenbank verglichen werden, um das Subjekt zu identifizieren.

Natürlich wird die thermische Gesichtserkennung normalerweise vom Militär verwendet, es gibt sie nicht bei Khols und sie wird auch nicht mit Ihrem nächsten Mobiltelefon geliefert. Außerdem funktioniert die Wärmebildkamera tagsüber (oder in allgemein gut beleuchteten Umgebungen) nicht gut, sodass sie außerhalb des Militärs nicht viele potenzielle Anwendungen hat.

  So schützen Sie Apps auf Ihrem Mac mit einem Passwort

Einschränkungen der Gesichtserkennung

Wir haben viel Zeit damit verbracht, über die Mängel der Gesichtserkennung zu sprechen. Wie wir anhand von IR- und Wärmebildaufnahmen gesehen haben, ist es möglich, einige dieser Einschränkungen zu überwinden. Aber es gibt noch ein paar Probleme, die noch nicht geklärt sind:

Behinderung: Wie zu erwarten, können Sonnenbrillen und anderes Zubehör eine Gesichtserkennungssoftware zum Stolpern bringen.
Posen: Die Gesichtserkennung funktioniert am besten mit einem neutralen, nach vorne gerichteten Bild. Ein Neigen oder Drehen des Kopfes kann die Gesichtserkennung erschweren, selbst für IR-basierte Erkennungssoftware. Darüber hinaus können ein Lächeln, aufgedunsene Wangen oder jede andere Pose die Art und Weise ändern, wie ein Computer Ihr Gesicht misst.
Licht: Alle Formen der Gesichtserkennung basieren auf Licht, egal ob es sich um sichtbares Spektrum oder IR-Licht handelt. Daher können ungewöhnliche Lichtverhältnisse die Genauigkeit der Gesichtserkennung beeinträchtigen. Dies kann sich ändern, da Wissenschaftler derzeit entwickeln Sonarbasierte Gesichtserkennungstechnologie.
Die Datenbank: Ohne eine gute Datenbank kann die Gesichtserkennung nicht funktionieren. In diesem Sinne ist es unmöglich, ein Gesicht zu identifizieren, das in der Vergangenheit nicht korrekt identifiziert wurde.
Datenverarbeitung: Je nach Größe und Format einer Datenbank kann es eine Weile dauern, bis Computer Gesichter richtig erkennen. In einigen Situationen, wie beispielsweise bei der Polizei, schränken Einschränkungen bei der Datenverarbeitung die Verwendung der Gesichtserkennung für alltägliche Anwendungen ein (was wahrscheinlich eine gute Sache ist).

Derzeit können diese Einschränkungen am besten durch andere Formen der Identifizierung in Verbindung mit der Gesichtserkennung umgangen werden. Ihr Telefon fragt nach einem Passwort oder einem Fingerabdruck, wenn Ihr Gesicht nicht erkannt wird, und die Chinesische Regierung verwendet ID-Karten und Tracking-Technologie, um die Fehlerquote in seinem Gesichtserkennungsnetzwerk zu schließen.

In Zukunft werden Wissenschaftler sicherlich einen Weg finden, diese Probleme zu umgehen. Sie können Sonartechnologie zusammen mit Lidar verwenden, um 3D-Gesichtskarten in jeder Umgebung zu erstellen, und sie können in unglaublich kurzer Zeit Wege finden, Gesichtsdaten zu verarbeiten (und Fremde zu identifizieren). In jedem Fall birgt diese Technologie ein hohes Missbrauchspotenzial, daher lohnt es sich, Schritt zu halten.

Quellen: Die Universität Rijeka, Die Electronic Frontier Foundation