Zugegeben, das hat wenig mit dem zu tun, was wir unter künstlicher Intelligenz verstehen. Aber der analoge Impuls war ein ganz ähnlicher wie der, den man heute in vielen Experimenten mit der generativen KI findet. Menschen interagieren mit Engines, füttern Anweisungen in sie ein. Lassen sich von ihnen ein Kunstwerk bauen, das aus existierendem Input gespeist wird, aber exakt ihren Tageswünschen entspricht.

So könnte auch Zander die Kunden jetzt bitten, ihm zusätzliche Stichworte über das Geburtstagskind zu schicken. Könnte daraus von der KI komplett individuelle Songs dichten und von der Software produzieren lassen, die mit seiner Stimme trainiert wurde. Sogar im automatisierten 24-Stunden-Online-Service. Obwohl er dann das Risiko in Kauf nähme, dass ihn irgendwer eine Geburtstagsode an Adolf Hitler singen ließe. Und so weiter.

Dass das alles längst geht, auch ohne Okay von irgendwem, haben wir gelernt. Wir haben wilde Deepfake-Videos gesehen, in denen Respektspersonen grässlichen Mist zu erzählen scheinen. 2023 wurde der Song „Heart On My Sleeve“, etikettiert als Duett der Sänger Drake und The Weeknd, allein auf Tiktok 15 Millionen Mal gesehen und gehört – bevor der Musikkonzern Universal ihn aus dem Netz fischte. Denn der Imitator hatte für seine KI-Kreation nicht nur die Stimmfarben der zwei Stars kopiert. Sondern damit auch noch Geld verdient. Billboard überschlug, dass der Fake-Song bis zum Verbot fast 10 000 Dollar Streaming-Umsatz brachte.

„Voice Cloning“ ist der Fachbegriff dafür. Wer es weitgehend straffrei ausprobieren will, kann ein Konto bei Jammable.com eröffnen. Auf der Plattform werden Tausende Stimmen zur unbeschränkten Verfügung angeboten, von Taylor Swift über Bob Marley bis Homer Simpson, ein Monatsabo kostet zwischen zwei und zehn Euro. Die Ergebnisse sind zum größten Teil rätselhaft bis lächerlich. Aber so ist es ja oft mit den ersten Schritten in eine neue, schon ziemlich greifbar wirkende Welt.

Das Start-up, das hinter Jammable steht, wird verschärft beobachtet. Im März 2024 schickte der britische Musikindustrieverband BPI ein Warnschreiben an die Firma und kündigte an, juristisch gegen sie vorzugehen. Es ist eine glasklare Logik, die zuletzt viele Rechteinhaber öffentlich erklärt haben: Wer eine KI-Engine mit einem Modell von Björks Stimme anbietet, muss sie vorher zwangsläufig mit copyrightgeschützten Aufnahmen von ihr trainiert haben. Muss diese falsche Björk anschließend gegen Gebühr die „Marseillaise“, das „Bibi und Tina“-Lied oder das sprichwörtliche Telefonbuch von Gütersloh singen – dann ist das ein gewaltiges Problem. Zumindest, solange die echte Björk und ihre Rechteverwerter das nicht verhindern können. Und auch nicht am Umsatz beteiligt werden.

Was das Thema Kunst und KI betrifft, ging zuletzt so vieles durcheinander, gab es viel nutzlose Panik und noch nutzloseres Visions-Blabla. Beim Voice Cloning allerdings kommt man wirklich ans Eingemachte. Weil die menschliche Stimme nun mal der Punkt ist, an dem man, auch beim besten Willen, Werk und Künstler nicht mehr trennen kann.

Schon in prä-algorithmischer Zeit sorgten Stimmimitatoren für Verwirrung

Was die vor Monaten angekündigten Schritte gegen Jammable betrifft, gebe es noch nichts Neues, lässt die BPI auf Anfrage ausrichten. An anderen Orten wird der Widerstand dagegen konkreter. Der US-Musikbranchenverband RIAA verklagte im Juni die KI-Song-Start-ups Udio und Suno, es geht um hohe Summen. Die Klage der deutschen Gema gegen die Chat-GPT-Mutterfirma Open AI dreht sich zwar in erster Linie um Songtexte, aber dabei natürlich auch – ums Prinzip. Ähnlich wie die juristischen Initiativen mehrerer Autoren und Verlage gegen die kalifornische KI-Firma Anthropic, der New York Times gegen Open AI und Microsoft. Und der Schauspielerin Scarlett Johansson, die einen Chat-GPT-Stimmassistenten erfolgreich wegklagte. Dessen Timbre war ihrer Klangfarbe so ähnlich, dass selbst enge Freunde geglaubt haben sollen, da spreche sie selbst.

Wo hier der Goldwert für die Abmahnanwälte liegt, kann man mit vulgärster Küchenpsychologie erkennen. Denn die Urheberrechte, die beim unlizenzierten Einsatz von Musik oder Filmen zum KI-Training verletzt werden (oder auch nicht), sind nur die eine Seite. Auf der anderen stehen die Persönlichkeitsrechte – wer will sich schon die Stimme klauen lassen? Würde ein KI-Prompter den Eindruck erwecken, Campino habe ein Lied der Böhsen Onkelz nachgesungen, wäre das schlicht die musikalische Version des bösen, altbewährten Enkeltricks.

Auch das gab es schon in prä-algorithmischer Zeit. In einem berühmten Fall hatte 1986 die Autofirma Ford bei der Sängerin Bette Midler angefragt, ob sie für die Mercury-Sable-Werbung den Klassiker „Do You Wanna Dance?“ interpretieren wolle. Midler wollte nicht. Den Spot gab es trotzdem: Die Agentur engagierte eine Imitatorin, die das Lied im Stil der Diva sang. 1988 bekam Bette Midler von einem US-Bezirksgericht zugesprochen, dass ihre Stimme ein Identitätsausweis sei, der für die Werbung nicht einfach nachempfunden und zweckentfremdet werden dürfe. Ford musste ihr 400 000 Dollar zahlen.

Ähnliche Geschichten gibt es von Tom Waits. Gerhard Schröder dagegen ließ 2003 den sogenannten Gummikanzler gewähren, der mit seiner parodierten Stimme an der ESC-Vorentscheidung teilnahm. Und Dritter wurde.

Die KI-Gegenwart schafft hier natürlich völlig neue Dimensionen und juristische Rätsel, durch die sich Anwalt- und Richterschaften erst mal durchfressen müssen. Eines davon, zu dem verschiedene US-Gerichte schon Unterschiedliches entschieden haben: Muss man das Training einer KI mit geschützten Inhalten nicht als zulässige Art der Inspiration betrachten („Fair Use“, wie es in den USA heißt), solange daraus eigenständige Kunstwerke entstehen? Und wenn ja: Steht hinter dieser Ansicht nicht eine viel zu naive Gleichsetzung der Werke, die Menschen auf der einen, Computer auf der anderen Seite erschaffen? Und können irdische Firmen überhaupt Copyrights für Musik oder Texte einklagen, die eine KI-Engine für sie ausgerechnet hat?

Die Antwort könnte deshalb besonders wichtig werden, weil für die Branche im Deepfake-Thema ja nicht nur Ärger steckt. Sondern auch ein mögliches, vielleicht millionenseliges Geschäftsmodell. Da wäre man dann wieder beim Vorbild Frank Zander, der seine Geburtstags-CDs schon vor 20 Jahren in sechsstelligen Auflagen verkaufte. Wenn Musikfirmen in Zukunft aktiv mit den KI-Betreibern zusammenarbeiten, die Stimmen ihrer Künstlerinnen und Künstler offiziell zum Training lizenzieren und dafür am Umsatz beteiligt werden – dann könnte Cloning-Musik auf Dauer zum validen Ertragsstrom werden. Zum Profitbringer, der wie Streaming-Umsätze, Konzertgagen oder T-Shirt-Verkäufe fest ins Portfolio von Popstar-Marken eingeplant wird.

Wird es also in zehn Jahren eine automatische Taylor Swift geben, bei der sich die Kollegstufe des Mörike-Gymnasiums ihre Abihymne bestellt? Oder ein alternder Jeanette-Biedermann-Fan eine Coverversion von „Rock My Life“?

„Ich bin doch kein beschissener Roboter!“, schreibt der Sänger der „Dead Boys“ auf Instagram

Es ist derzeit schwierig, Antworten darauf zu bekommen. Leute aus der Industrie beantworten die Fragen ungern oder gar nicht. Man liest und hört zwar oft, dass heiße Kooperationsverhandlungen zwischen Entertainment- und Techfirmen stattfinden, aber Ergebnisse werden selten verkündet. Der zu Google gehörige Videodienst Youtube überraschte Ende 2023 mit dem Tool „Dream Track“, das es Usern erlauben soll, KI-Soundtracks für Clips zu generieren – und dafür auch zeitweise die (offenbar abgesegneten) Stimmen von neun Stars zur Verfügung stellte, unter anderem Charli XCX, Sia und John Legend. Seit Mai funktioniert das Feature nur noch instrumental, benutzen dürfen es bisher ohnehin nur ausgewählte Testgruppen. Trotzdem ist es ein kleines Zeichen dafür, was die Verhandlungen ergeben könnten, wenn Rechtslage und Infrastruktur geklärt sind.

In den USA schießen derweil die Start-ups aus dem Boden, die Künstlerinnen und Künstlern anbieten, ihre Stimmen schon heute für den KI-Einsatz zu vermarkten. Sie heißen Vermillio und Voice Swap, Hooky und Myvox, und ihre Geschäftsidee ist klar: so schnell wie möglich eine Struktur für Hunderttausende Kreative zu schaffen, die nie berühmt genug sein werden, um bei Deal-Schlachten ein Druckmittel für die Konzerne zu sein. Die erfolgreiche, schon immer mit einem Fuß im Cyberspace tanzende Künstlerin Claire Elise Boucher, genannt Grimes, eröffnete bereits im April 2023 eine Plattform, über die man seither ihre Singstimme adaptieren kann. Allerdings schreibt sie vor, dass zum digitalen Vertrieb der fertigen Songs der Dienst Tunecore verwendet werden muss. Natürlich will sie am Umsatz teilhaben.

Der letzte Einwand bleibt dagegen reines Gefühl. Im Fall Zander war es schließlich die Illusion, der Sänger wäre extra für Oma Lotte ins Studio gegangen, die dem Schunkellied seinen wirkmächtigen Reiz gab. Sollte die Zeit kommen, in der alle jederzeit eigene Songs mit den großen Stimmen machen können, in der also auch die letzte Suggestion von Einzigartigkeit wegfällt – wird es dann noch irgendwen interessieren? Oder könnte das Angebot die letzten überlebenden Fans nicht eher sogar aggressiv machen?

So wie Jake Hout, den aktuellen Anführer der legendären US-Punkband Dead Boys. Vergangenen Sommer bat ihn die Plattenfirma, fürs kommende Album einige spezielle Gesangslinien einzusingen – die man zur Feier des Gruppenjubiläums mit der KI-Stimme des 1990 verstorbenen Originalsängers Stiv Bators nachmodellieren wollte. Hout fand die Idee so würdelos, dass er nun seinen Ausstieg aus der Band bekannt gab. „Ich bin doch kein beschissener Roboter!“, verkündete er auf Instagram.

Solchen Aussagen nimmt man Künstlern ohne Weiteres ab. Noch.