Technologie

Neuer KI-gestützter Dienst verwandelt Porträts in sprechende Köpfe

                                            Ein neuer Dienst, der auf künstlicher Intelligenz basiert und Porträts in sprechende Köpfe verwandeln kann, wurde am Montag von D-ID angekündigt.

Die Self-Service-Anwendungen mit dem Namen Creative Reality Studio können das Bild eines Gesichts in ein Video verwandeln, komplett mit Sprache.

Der Service richtet sich an Ersteller von Geschäftsinhalten – Lern- und Entwicklungsabteilungen, Personalabteilungen, Marketingspezialisten, Werbetreibende und Verkaufsteams –, aber jeder kann die Technologie auf der D-ID-Website ausprobieren.

Creative Reality Studio-Video von John P. Mello Jr.

Die Plattform reduziert die Kosten und den Aufwand für die Erstellung von Unternehmensvideoinhalten und bietet eine unbegrenzte Vielfalt an Präsentatoren – im Gegensatz zu begrenzten Avataren – einschließlich der eigenen Fotos der Benutzer oder aller Bilder, zu deren Verwendung sie berechtigt sind, so das Unternehmen, das eine gewisse Bekanntheit erlangte seine Technologie wurde in einer App namens Deep Nostalgia verwendet. Die Software wurde entwickelt, um alte Porträts zu animieren.

Das Unternehmen fügte hinzu, dass die Technologie es Kunden und Benutzern ermöglicht, die Identität eines Moderators auszuwählen, einschließlich seiner ethnischen Zugehörigkeit, seines Geschlechts, seines Alters und sogar seiner Sprache, seines Akzents und seiner Intonation. „Dies bietet eine größere Repräsentation und Vielfalt, was zu einem stärkeren Gefühl der Inklusion und Zugehörigkeit führt und das weitere Engagement und die Interaktion mit den Unternehmen fördert, die es nutzen“, heißt es in einer Pressemitteilung.

„Zu den Anwendungsfällen gehört es, Ersteller von Geschäftsinhalten in die Lage zu versetzen, Videos nahtlos in digitale Räume und Präsentationen mit dem exklusiven PowerPoint-Plug-in zu integrieren und ansprechendere Inhalte mit angepassten Unternehmensvideosprechern zu erstellen“, sagte Matthew Kershaw, Marketing-Vizepräsident von D-ID, gegenüber TechNewsWorld.

Beeindruckende Leistungen

Die Qualität dieser Dienste ist ziemlich beeindruckend und wird immer besser, sagte Daniel Castro, Vizepräsident der Information Technology and Innovation Foundation, einer Forschungs- und Politikorganisation in Washington, DC

„Dieser Dienst ist nicht auf dem Niveau, wo er einen Moderator vollständig ersetzt, aber es gibt keinen Grund, nicht zu erwarten, dass er relativ bald dorthin kommt“, sagte er gegenüber TechNewsWorld.

D-ID erklärte, dass die Nutzung von Videos durch Unternehmen dramatisch zugenommen hat und immer mehr von ihnen es in ihre Schulungs-, Kommunikations- und Marketingstrategien integrieren.

Beschleunigt wird dieser Trend durch die sich schnell entwickelnden Welten der Avatare und des Metaversums, die beide einen kreativeren, immersiveren und interaktiveren Content-Ansatz von digitalen Schöpfern verlangen. Produktionsbudgets können jedoch unerschwinglich teuer sein und einen erheblichen Zeit- und Talentaufwand erfordern.

„Der Service ist eine Weiterentwicklung der heute verwendeten Avatare und Emojis, kann aber auch für längere Diskussionen oder Präsentationen genutzt werden“, bemerkte Ross Rubin, Chefanalyst bei Reticle Research, einem Beratungsunternehmen für Verbrauchertechnologie in New York City.

„Die Idee ist, Zeit zu sparen, besonders wenn Sie ein Skript vorlesen würden“, sagte er gegenüber TechNewsWorld. „Es kann für ein Publikum ansprechender sein als nur Audio oder das Ansehen von Folien.“

Demokratisierung von KI

Gil Perry, CEO und Mitbegründer von D-ID, stellte in einer Pressemitteilung fest, dass die Technologie des Unternehmens, die auf Unternehmen beschränkt war, zur Erzeugung von 100 Millionen Videos verwendet wurde.

„Jetzt, da wir unsere Self-Service-Creative-Reality-Plattform anbieten, ist das Potenzial riesig“, fuhr er fort. „Es ermöglicht sowohl größeren Unternehmen als auch kleineren Unternehmen und Freiberuflern, personalisierte Videos für eine Reihe von Zwecken in großem Umfang zu produzieren.“

Kershaw fügte hinzu, dass die Technologie von D-ID die Kreativität weiter demokratisieren wird. „Ich sage ‚weiter‘, weil Technologie die Künste tatsächlich schon seit Jahrzehnten demokratisiert“, sagte er.

„Von der Einführung von Synthesizern, Samplern und Sequenzern in der Musik über Photoshop und Illustrator in Fotografie und Illustration bis hin zu Premier und Desktop-Bearbeitung und Bewegungsgrafiken in der Filmproduktion war die Fähigkeit, hochwertige Produktionen außerhalb spezialisierter High-End-Studios zu erstellen, gegeben seit den 1980er Jahren passiert“, sagte er. „Dies ist nur die neueste Folge dieser langjährigen Serie.“

„Es ist definitiv ein Schritt nach vorn in Richtung Demokratisierung der KI“, stimmte Avivah Litan, Sicherheits- und Datenschutzanalystin bei Gartner, zu. „Es hat viele großartige Anwendungsfälle im Bildungswesen, im Gesundheitswesen und im Einzelhandel“, sagte sie gegenüber TechNewsWorld. „Es ist einfach eine bessere Art, mit Menschen zu kommunizieren. Wir werden zu einer viel visuelleren Gesellschaft. Niemand hat Zeit, etwas zu lesen.“

Deepfake-Bedenken

Angesichts der wachsenden Besorgnis über die Verwendung von „Deepfakes“ zur Verbreitung von Fehlinformationen und zur Erhöhung des Social Engineering auf neue Höhen, besteht immer das Potenzial des Missbrauchs neuer synthetischer Medienlösungen wie D-IDs.

„Wie bei jeder Technologie kann auch unsere von schlechten Akteuren missbraucht werden, aber unsere Plattform richtet sich an legitime Unternehmen, die kein Interesse an dieser Art der Nutzung haben“, sagte Kershaw.

„Außerdem“, fuhr er fort, „sind wir kein Deepfake. Wir legen nicht das Gesicht einer anderen Person auf den Körper einer anderen Person, und wir versuchen nicht, jemanden dazu zu bringen, etwas zu sagen, was er nicht gesagt hat.“

„Innerhalb der Plattform von D-ID haben wir mehrere Sicherheitsvorkehrungen getroffen, um sicherzustellen, dass unsere Technologie nicht auf diese Weise verwendet wird“, fügte er hinzu. „Wir replizieren nicht die Stimme von Prominenten oder ohne die Erlaubnis einer Person.“

Das Unternehmen filtert auch Schimpfwörter und rassistische Äußerungen und sperrt die Plattform für die Erstellung politischer Videos.

„D-ID bringt Leitplanken auf seiner Plattform an, aber wir alle wissen, dass Leitplanken nie perfekt sind“, bemerkte Litan.

„Es ist ein großartiges Werkzeug, um Fehlinformationen zu verbreiten, weil diese Social-Media-Sites nicht auf Deepfakes vorbereitet sind“, sagte sie. „Auch wenn die Social-Media-Seiten gut darin werden, Deepfakes zu identifizieren, werden sie nie gut genug werden. Es ist wie Spam. Spam kommt immer durch. Das wird auch durchkommen, aber die Folgen werden schlimmer sein.“

Provenienz benötigt

Das Erkennen von Deepfakes sei auf lange Sicht ein Verlustgeschäft, sagte Litan. Auch heute können Erkennungsalgorithmen in der Regel mehr als 70 % der Deepfakes nicht erkennen.

Sie fügte hinzu, dass entschlossene Gegner mit der Deepfake-Erkennung Schritt halten werden, indem sie generative gegnerische Netzwerke verwenden, sodass die Erkennungsraten schließlich auf bis zu 50 % sinken werden.

Sie prognostiziert, dass im Jahr 2023 20 % der erfolgreichen Kontoübernahmeangriffe Deepfakes verwenden werden, um Benutzer durch Social Engineering dazu zu bringen, vertrauliche Daten weiterzugeben oder Geld auf kriminelle Konten zu verschieben.

„Viele Schutzmaßnahmen müssen branchenweit angewendet werden, weshalb wir auch mit Branchenverbänden und Aufsichtsbehörden zusammenarbeiten, um rechtliche Schutzmaßnahmen einzuführen, die die Branche im Allgemeinen sicherer und zuverlässiger machen“, sagte Kershaw. „Wir glauben, dass insbesondere ein branchenweites System zum unsichtbaren Wasserzeichen von Inhalten durch die Verwendung von Steganografie fast alle potenziellen Probleme beseitigen würde.“

„Sie könnten ein Medium sehen und durch Klicken auf eine Schaltfläche auch seine Herkunft sehen, woher es kommt und was es enthält“, bemerkte er. „Transparenz ist die Lösung.“

„Es gibt viele Möglichkeiten, mit Fälschungen umzugehen, aber das Wichtigste ist, die Herkunft und Authentizität von Medien zu kennen“, fügte Castro hinzu.

Bild & Quelle: TechNewsWorld

Kommentar verfassen

Ähnliche Artikel

Schaltfläche "Zurück zum Anfang"

Adblock erkannt!

Adblocker speichern und verwenden Ihre personenbezogenen Daten und verkaufen diese u.U. an Dritte weiter. Schalten Sie in Ihrem und unserem Interesse den Adblocker aus. Keine Angst, wir verwenden keine Popups oder Umleitungen. Ein paar kleine, unauffällige Banner finanzieren uns einen Kaffee. Sonst gibt's hier keine Werbung.