Videokonferenzen, Podcasts und Webinare wurden in den Pandemiejahren 2020 und 2021 immer beliebter, als Fernarbeit Teil der neuen Normalität wurde. Mit der Pandemie jetzt im Rückspiegel haben die Videokommunikationstechniken keine Anzeichen einer Verlangsamung gezeigt.
Was mich amüsiert hat, ist, dass trotz der Verbreitung von Videokommunikation, wie wenig schmeichelhaft wir oft vor der Kamera mit leistungsschwachen Webcams mit niedriger Auflösung erscheinen, zu wenig Aufmerksamkeit erregt. Schlechte Beleuchtung, vor allem bei der Nutzung von Videoanrufen von zu Hause aus, ist zweifellos ein großes Problem. Webcams mit Sub-HD-Auflösung, die in die meisten, sogar High-End-Laptops eingebaut sind, helfen nicht.
Ohne die professionellen Mittel, die in einem professionellen Fernsehstudio verfügbar sind, sehen Politiker, Prominente und Branchenexperten oft gespenstisch aus, wenn sie von zu Hause aus interviewt werden.
Routinemäßige Videokonferenzanrufe von zu Hause aus sind besonders anfällig für ein „Amateurstunden“-Look-and-Feel, insbesondere während einer formellen Präsentation, bei der wandernde Blicke (z. B. nicht direkt in die Webcam blicken) den Betrachter ablenken können.
Verantwortlich für diesen unerwünschten Effekt ist die Position der Webcam, denn die Kamera ist in der Regel oben im Laptop-Panel integriert oder auf einem separaten Standfuß, der sich nur schwer vor einem Desktop-Display platzieren lässt.
Da typische Videokonferenzen mit einem Desktop- oder Laptop-PC nicht über die richtige Teleprompter-Funktion verfügen, die komplex, sperrig und teuer ist, ist es fast unmöglich, Sprechernotizen zu lesen, ohne das lästige Phänomen eines schrecklichen Webcam-Winkels zu vermeiden, der Ihre Nase hoch oder runter starrt .
Gibt es schnelle Möglichkeiten, das Augenproblem zu beheben?
Es gibt einige Möglichkeiten, dieses Problem in einem typischen Desktop- oder Laptop-Home-Setup zu entschärfen. Diese Ansätze sind jedoch rein effekthascherisch und beseitigen das Problem nicht.
Einige Unternehmen bieten winzige externe Webcams an, die oft ohne integriertes Mikrofon ausgestattet sind, um die Größe des Geräts zu reduzieren und eine Platzierung in der Mitte Ihres Bildschirms vor Textmaterial oder dem Anzeigefenster selbst der von Ihnen verwendeten Video-App zu ermöglichen.
Diese Kameras verwenden einen dünnen Draht, der an der Oberseite des Displays drapiert und befestigt wird. Auf diese Weise blicken Sie direkt in die Webcam und können das meiste, wenn auch nicht das gesamte Präsentations- oder Textmaterial sehen, das Sie präsentieren.
Eine andere Methode ist die Verwendung eines durchsichtigen Stücks Acrylkunststoff, mit dem Sie fast jede Webcam montieren und an der Oberseite des Displays einhängen können, sodass die Webcam vor dem Mittelpunkt des Displays hängt.
Der Vorteil dieses Ansatzes besteht darin, dass Sie Ihre bevorzugte Webcam verwenden können. Der Nachteil ist, dass die Größe der Webcam und der Acrylplastikapparat oft einen großen Teil des Bildschirms verdecken, was sie als Teleprompter-Alternative weniger nützlich macht.
Auf der anderen Straßenseite sehen wir möglicherweise Laptop- und PC-Displays mit integrierten Webcams hinter dem LCD-Panel, die für den Benutzer unsichtbar sind. Während dies eine ideale Lösung für das oben beschriebene Problem ist, besteht der Nachteil darin, dass die Kosten für diese Spezialdisplays sehr hoch sein werden, was die meisten Hersteller aufgrund der Auswirkungen auf die Preiselastizität zurückhaltend anbieten werden.
KI kann Augenkontaktprobleme bequem und kostengünstig beheben.
Die Idee, künstliche Intelligenz einzusetzen, um den Blickkontakt bei Videokonferenzen abzumildern oder zu eliminieren, ist nicht neu. Wenn es richtig gemacht wird, kann KI die Notwendigkeit beseitigen, teure Teleprompt-Geräte zu kaufen, die Fernsehstudios verwenden, oder auf einige der oben beschriebenen effekthascherischen Methoden zurückzugreifen.
Die Herausforderung beim Einsatz von KI zur Durchführung von Augenkontaktkorrekturen im laufenden Betrieb (live) oder sogar in einem aufgezeichneten Szenario besteht darin, dass Prozessorleistung erforderlich ist, um einen Großteil der schweren Arbeit zu erledigen.
Apple Silicon verfügt mit seinen iPhone-Chips seit einigen Jahren über diese integrierte Fähigkeit. Nicht viele Benutzer wissen, dass Apples FaceTime-App über eine Augenkontaktkorrektur verfügt (die ausgeschaltet werden kann), die sicherstellt, dass Ihr Blick auf die Mitte des Bildschirms gerichtet ist, unabhängig von der Ausrichtung des iPhones.
Augenkontakt-Einstellung in Apples FaceTime-App
Microsoft hat sich auch der KI-Partei angeschlossen, um Augenkontaktprobleme zu beheben. Letztes Jahr kündigte das Unternehmen an, Windows 11 um Augenkontaktlösungen zu erweitern, indem es die Leistungsfähigkeit der Arm-Lösungen von Qualcomm nutzt und die Vorteile von NPU-Silizium (Neural Processing Unit) nutzt, um Video und Audio in Besprechungen zu verbessern – einschließlich Themenrahmen, Unterdrückung von Hintergrundgeräuschen , und Hintergrundunschärfe.
Viele dieser Funktionen waren bereits auf dem Surface Pro X-Gerät von Microsoft verfügbar, das einen Arm-Chip verwendet. Dennoch wird Microsoft diese Funktionalität in diesem Jahr auf kompatibleren Modellen von großen PC-OEMs auf breiter Basis bereitstellen.
Nvidia-Übertragung mit Blickkontakt
Die Broadcast-App von Nvidia, die auf einer Vielzahl von externen Nvidia-Grafikkarten funktioniert, ist ein robustes KI-Tool, das Videoanrufe und Kommunikation auf x86-basierten PCs verbessert. Letzte Woche hat Nvidia das Dienstprogramm in Version 1.4 verbessert, um die Implementierung von Augenkontakt zu unterstützen, wodurch es so aussieht, als würde das Motiv im Video direkt in die Kamera schauen.
Der neue Eye Contact-Effekt passt die Augen des Sprechers an, um den Augenkontakt mit der Kamera zu reproduzieren. Diese Fähigkeit wird mithilfe der KI-Pferdestärke in den GPUs von Nvidia erreicht, um den Blick genau einzuschätzen und auszurichten.
Der neue Augenkontakt-Effekt in Nvidia Broadcast 1.4 bewegt die Augen des Sprechers, um den Augenkontakt mit der Kamera zu simulieren. | Bildnachweis: Nvidia
Der Vorteil von Nvidias Ansatz besteht darin, dass die Fähigkeit nicht auf eine einzelne Videokonferenzplattform oder -anwendung beschränkt ist. Apple unterstützt seine Augenkontakt-Korrekturfunktion nur mit der FaceTime-App des iPhones. Ich wäre jedoch nicht überrascht, wenn Apple diese Funktion später in diesem Jahr in Verbindung mit seiner Continuity Camera-Funktion auf macOS-Benutzer ausdehnt.
Darüber hinaus bietet Nvidia Broadcast Vignette-Funktionen, die mit denen vergleichbar sind, die viele Benutzer von Instagram-Apps erleben. Auf diese Weise kann Nvidia Broadcast eine dezente Hintergrundunschärfe erzeugen, um ein KI-simuliertes verschwommenes Bild auf Ihrer Webcam zu erhalten, wodurch die visuelle Qualität sofort verbessert wird.
Das Ersetzen von Hintergrundbildern bei Videokonferenzen ist nichts Neues. Dennoch wird Nvidias Ansatz vermutlich eine bessere Qualität bieten, da es die Leistung seiner Grafikkarten nutzt, die für die Erstellung von Videoinhalten und Spiele optimiert sind.
Abschließende Gedanken
Die Augenkontaktfunktion in Nvidias Broadcast-App befindet sich derzeit in der Beta-Form und ist noch nicht für den Einsatz geeignet. Wie jedes Beta-Feature wird es unter unvermeidlichen Störungen leiden, und wir sollten die formelle Beurteilung seiner Qualität aufschieben, bis die Produktionsversion verfügbar ist.
Darüber hinaus ist Nvidia Broadcast nicht nur eine gewöhnliche App, sondern ein offenes SDK mit Funktionen, die in Apps von Drittanbietern integriert werden können. Das eröffnet interessante neue Möglichkeiten für Anwendungen von Drittanbietern, die Funktionalität von Nvidia Broadcast direkt zu nutzen.
Trotzdem bin ich erstaunt über einige der Nebenwirkungen, die in den letzten Jahren in Bezug auf die Aussicht auf die Verwendung von KI zur Korrektur des Augenkontakts aufgetreten sind. Einige Tech-Analysten haben Ausdrücke wie den „Gruselfaktor“ verwendet, um diese Funktion so unattraktiv wie möglich zu kategorisieren.
In der Tat wird die Fähigkeit viele, vielleicht verdiente Witze anregen, wenn die Nachwirkung unnatürlich und künstlich aussieht. Die gruselige Bezeichnung wirkt jedoch übertrieben und unaufrichtig. Man könnte die gleiche Andeutung machen, wenn es darum geht, Make-up zu verwenden oder erweiterte Tools einzusetzen, die Audiomängel während eines Videoanrufs korrigieren. Apps wie TikTok oder Instagram gäbe es nicht ohne Filter, die meiner Meinung nach weitaus gruseligere Bilder erzeugen.
Ob es Ihnen gefällt oder nicht, Videokonferenzen haben als eines der positiven Ergebnisse der Welt nach der Pandemie überlebt. Der Einsatz von Technologie, die produktivere, überzeugendere und wirkungsvollere Videoanrufe ermöglicht, ist etwas, das wir begrüßen und nicht verachten sollten.
Als jemand, der einen wöchentlichen Video-Podcast produziert und das Potenzial erkennt, den Blick zu eliminieren oder sogar zu reduzieren, was wiederum teleprompterähnliche Vorteile bringen könnte, freue ich mich darauf, diese dringend benötigte Fähigkeit in den nächsten kommenden Wochen zu testen.
Bild & Quelle: TechNewsWorld