Suno AI ist ein Text-Audio-Modell. Es kann sehr realistische, mehrsprachige Sprache sowie andere Audiosignale, einschließlich Musik, Hintergrundgeräusche und einfache Soundeffekte, erzeugen.
Einfach ausgedrückt hast du die Möglichkeit mit Suno KI generierte Songs samt gesungener Stimme zu generieren. Die Texte stammen aus ChatGPT und Bark (von Suno AI) übernimmt die Erzeugung von Songs.
Die Künstliche Intelligenz (KI) hat einen weiteren Schritt in die Welt der Musik gemacht. Mit Suno, einem KI-Tool, kannst du jetzt aus Textprompts kleine Songs generieren. Ja, du hast richtig gehört. Es geht nicht nur um die musikalische Untermalung, sondern auch um den Gesang, der zur Musik passt.
Suno: KI-Musik generieren
Suno hat mich wirklich beeindruckt. Es ist nicht perfekt, aber die Technologie ermöglicht es, aus eigenen Songtexten erste kleine Songs zu erzeugen. Die KI „singt“ in verschiedenen Stilen deinen Text zu einer passenden musikalischen Untermalung. Das Ergebnis sind ganz unterschiedliche Songs und Stile. Manchmal wird gerappt oder auch mal eine Rock-Version erstellt.

Wie funktioniert Suno?
Ähnlich wie auch das KI-Tool Midjourney, läuft Suno aktuell noch über Discord. Hier kannst du einfach per Befehl (/chirp) das entsprechende Fenster öffnen in dem du dann deinen Songtext, Stil oder Thema eingeben kannst.

Genres von KI-Songs definieren
Die Qualität ist noch nicht perfekt, wie du im Video hören kannst. Aber bedenke, wie schwierig es ist, einen zufälligen Text „gut“ zu singen und dazu auch noch in verschiedenen Stilen darzustellen. Zudem ist es gerade auch noch nicht auf andere Sprachen außer Englisch optimiert. Aber daran wird bereits gearbeitet.

Was kostet Suno?
Mit über 40.000 Usern in Discord, fallen schon einige Kosten an. Darum gibt es neuerdings zwei Pläne. Mit dem kostenlosen Plan kannst du 25 Songs pro Monat generieren. Brauchst du mehr Songs kannst du für $10 pro Monat 100 Songs generieren und (bei Bedarf) noch mehr Songs dazukaufen.

Qualität und Vielfalt: Die Stärken und Schwächen von Suno
Die Qualität ist noch nicht perfekt, wie du im Video hören kannst. Aber bedenke, wie schwierig es ist, einen zufälligen Text „gut“ zu singen und dazu auch noch in verschiedenen Stilen darzustellen. Zudem ist es gerade auch noch nicht auf andere Sprachen außer Englisch optimiert. Aber daran wird bereits gearbeitet.
Die Auswirkungen auf die Musikindustrie
Das Projekt ist noch sehr jung und erinnert mich an die Anfangszeiten von Runway (und schau, wo Runway mit den aktuellen Gen-2 Formaten jetzt steht). Wie wird die Musikindustrie auf eine solche Technologie reagieren? Werden Künstler bald nur noch als Quelle benutzt und werden Songs dann einfach mit entsprechenden Inputs und (bezahlten) Stimmen erzeugt? Können wir bald unsere „eigene“ Musik erzeugen? Je nach Stimmung oder in Kombination unterschiedlichster Stile, Artists und Genres? Ich weiß es nicht, aber ich sehe hier ähnliche Veränderungen wie damals mit „Napster“ und Co.
Wie das Handelsblatt berichtet (link) sprechen bereits Labels mit Unternehmen wie Google, um KI-generierte Musik vielleicht sogar selbst anzubieten oder diese auf Plattformen wie YouTube verwenden und auch monetarisierbar zu machen.

Bark: Die Open-Source-Lösung für KI-generierte Stimmen
Suno hat mit Bark bereits eine Lösung veröffentlicht, um Stimmen und Stimmungen mittels KI zu erzeugen. Der Bereich Musik wird nun auch angegangen. Mit Bark kannst du auf GitHub selbst Spaß haben. Über die offizielle Seite gelangst du zum entsprechenden Discord Server und kannst mittels Befehl (wie bei Midjourney) deine Songs erzeugen lassen.
Das GitHub Repo von Bark findest du hier: https://github.com/suno-ai/bark