Mietin kovasti otsikon verbiä, miten tekoäly saa aikaan musiikkia. En halunnut käyttää säveltää-verbiä, en myöskään tuottaa, sillä niissä on mielestäni suunnitelmallinen vivahde. Samoin luominen kuulostaa liian luovalta ja inhimilliseltä. Yhtä kaikki, jatkossa käytän näitä sanoja sekaisin ilmaisemaan sitä, että tekoäly on tehnyt musiikkia. En myöskään ole aivan varma, mitä tekoäly tekee. Onko se musiikkia? Vai onko se kasaan laitettua ääntä kappaleen verran? Hyvin nopeasti voi löytää itsensä pohtimasta filosofisesti, mitä musiikki on?
Tekoäly on lyönyt läpi muutaman viimeisen vuoden aikana erittäin laajasti lähes kaikilla aloilla. Lääketiede, media ja vaikkapa kaupan ala ottavat isoja askelia kohti tehokkuutta tekoälyn avulla. Suuret kielimallit mullistavat tiedonvälitystä, kuvaa ja videokuvaa voi muokata ja luoda mitä mielikuvituksellisimmilla tavoilla. Myös musiikkialalle tekoäly on tullut jäädäkseen. Tekoälyä voidaan hyödyntää monella eri tavalla musiikin parissa, esimerkiksi äänityksessä ja miksauksessa. Musiikkia voi kuitenkin nykyään myös luoda pelkän tekoälyn avulla. Tämä ns. generatiivinen tekoäly on mullistanut myös muiden luovien alojen työtä.
Tekoälyä käytettäessä on syytä muistaa, ettei tekoäly ole varsinaisesti älykäs, ajatteleva ja ihmiseen verratava suunnittelija ja vaihtoehtojen puntaroija. Tekoäly tekee sen mitä se on oppinut, tai generoi vastauksen, joka on sen aineiston perusteella looginen ja todennäköinen jatko edelliseen. Tekoälymallit voivat toistaa ja muunnella opittuja malleja, mutta ne eivät pysty luomaan täysin uusia ja innovatiivisia konsepteja kuten ihmisen luovuus.
Kuten muussakin tekoälyavusteisessa tekemisessä, myös musiikin tuottamisessa on tärkeää, millaisen ohjeen eli kehotteen (prompt) tekoälylle antaa. ”Promptaamista” kannattaa kokeilla hieman eri sanoin ja siihen löytyy myös paljon vinkkejä netistä.
Kehotteen suunnittelu on tärkeää, koska se vaikuttaa suoraan siihen, kuinka hyvin tekoäly ymmärtää ja tuottaa tarkoituksenmukaista ja hyödyllistä sisältöä. Hyvin suunniteltu kehotus voi parantaa tekoälyn suorituskykyä ja tuottaa tarkempia ja relevantimpia vastauksia.
Suno.ai
Musiikkia tuottavia generatiivisia tekoälyohjelmia on viime vuosina tullut lukuisia. Tutustuin Suno.ai-tekoälysovellukseen, joka toimii selaimessa. Muita suosittuja ovat tällä hetkellä esimerkiksi Soundraw, Mubert, Loudly ja AIVA. Valitsin kuitenkin kyseisen sovelluksen, koska sillä on tarkoitus tehdä kappale, jossa lauletaan, samplen tai loopin sijaan. Muutamat muut sovellukset on suunnattu esimerkiksi videoiden ilmaiseksi taustamusiikiksi. Sunossa on myös enemmän kuunneltavaa satunnaiselle vierailijalle ja yhteisö, joka jakaa omia tuotoksiaan aktiivisesti. Suno kertoo sivuillaan, että kehittäjät ovat muusikoita ja tekoälyasiantuntijoita Yhdysvalloista. Tiimin jäsenillä on kokemusta Metan ja TikTokin kaltaisista teknologiajäteistä. Heillä on myös ilmeisen kovat kasvuaikeet rekrytoinnin perusteella. Suno on myös Microsoft Copilotin lisäosa (plugin).
Sunoa kehitetään aktiivisesti. Maaliskuussa 2024 on ilmestynyt Suno v3-versio. Touko-kesäkuun vaihteessa v3.5-versio. Tämä versio lupaa mm. tyylikkäämmät lopetukset kappaleisiin ja laajemman tyylivalikoiman sekä jopa neljän minuutin pituisen kokonaisen kappaleen. Suno v3 on selvästi parempi kuin edeltäjä v2. Alkuvuodesta tehdessäni kokeiluja, kappaleiden rakenteet olivat vielä summittaisempia. Intron jälkeen saattoi tulla jonkinlainen esisäkeistöltä kuulostava osa, jonka jälkeen aloitettiin ikään kuin uudelleen alusta koko kappale. Kun tutut musiikin rakenteet loistivat poissaolollaan, oli olo vähän hutera. Tuntui, että koko kappale on tuuliajolla.
Käyttöliittymä on melko yksinkertainen. Etusivulta löytyy paljon kuunneltavaa, jota voi kuunnella kirjautumatta. Sivulla on mediasoitin, jolla voi kuunnella, kelata, säätää äänenvoimakkuutta ja jakaa kappaleen linkin. Ilman kirjautumista voi kuunnella etusivulta muiden julkaisemia kappaleita ja jakaa niitä linkkinä. Kirjautuminen onnistuu esimerkiksi Google– tai Microsoft-tunnuksilla. Hakutoiminnot, kappaleen luominen, soittolistojen tekeminen ja kappaleiden peukuttaminen vaativat kirjautumisen. Kirjautumisen jälkeen voi myös pidentää jonkun toisen kappaletta, tai uudelleen käyttää samaa promptia. Kirjautuneet käyttäjät voivat luoda päivässä ilmaiseksi kymmenen kappaletta ja jakaa niitä. Jos kappaleen haluaa ladata johonkin suoratoistopalveluun, silloin kappale pitää olla tehtynä maksullisen tilauksen aikana. Tilauksissa on pari eri laajuutta ja hinnat alkavat tällä hetkellä 8 e/kk.
Suno-sivustolla voi kuunnella muiden sinne tuottamaa musiikkia. Kirjautuneet käyttäjät voivat seurata toisiaan ja jakaa soittolistojaan. Kappaleita voi arvioida ylä- ja alapeukulla, joka on Sunon mukaan osa sen oppimista. Paljon peukutetut kappaleet kertovat algoritmille, että tässä on jotain ihmisten mielestä hyvää. Kuuntelin muutaman paljon peukkuja saaneen kappaleen. Ne kuulostivat selvästi paremmilta kuin minun nopeasti teettämät kappaleeni. Rakenteet olivat selkeämmät. Kappaleet olivat melko pitkiä ja niitä oli useimmiten jatkettu ensimmäisen luontikierroksen jälkeen. Tässäkin asiassa varmaan harjaantuu ja oppii promptaamaan tarkoituksenmukaisesti.
Kappaleen tekemiseen ei välttämättä tarvita kovin paljoa omaa panosta. Halutessaan saa tuotettua musiikkia klikkaamalla ohjelman ehdottamaa satunnaista promptia. Jos haluaa panostaa vähän enemmän, voi itse kuvailla kappaletta. Suno ohjaa ennemmin promptaamaan yleisiä genrejä, aiheita ja tunnelmia kuin olemassa olevia artisteja ja bändejä tai valmiita, olemassa olevia kappaleita. Tällä hetkellä on myös mahdollista valita, käyttääkö vanhempaa v2-versiota vai uudempia v3- ja v3.5-versioita.
Mahdollista on myös tehdä kappale ns. Custom Mode -tilassa, jolloin erilliseen tekstikenttään voi syöttää kappaleen sanoitukset. Sunossa on oma generatiivinen tekstityökalu, joka voi puolestasi generoida myös sanat. Halutessasi voit tietysti käyttää omaa tekstiä, jonkun muun tekemää tekstiä luvan kanssa tai pistää esimerkiksi Chat GPT tekemään tekstin kappaletta varten. Sunossa on mahdollista tehdä myös pelkästään instrumentaalikappaleita. Kappaleen voi ladata omalle laitteelle MP3-muodossa, maksavat käyttäjät myös WAV-tiedostona. Kappale on mahdollista jakaa myös linkkinä, jolloin voi houkutella uudenlaisen kuuntelutavan äärelle suoraan Suno-sivustolle.
Suno ei ymmärrä kaikkia musiikillisia asioita. Suno lupailee kuitenkin, että ainakin vanhemmassa ja valmiimmassa v2-versiossa sävellaji ja tempo ovat melko tarkasti määriteltävissä. Sinänsä kaikki perinteiset musiikilliset elementit ovat tekoälylle lähtökohtaisesti hepreaa. Se ei sävellä säveliä, rytmejä eikä fraaseja. Se tekee äänimassaa, jossa kuuluu näitä edellä mainittuja musiikiksi koettuja elementtejä.
Seuraava kappale on tehty sanoituksia myöten kokonaan Sunolla. Promptiksi annoin Kevät saapuu (title), suomenkielinen kevätaiheinen laulu (lyrics), catchy melodic pop rock (style of music). Tekstityökalu generoi ensiksi sanoituksen rakenteineen, jonka jälkeen kappale luotiin. Suno tekee aina yhdellä kertaa kaksi eri kappaletta samasta promptista. Näistä valitsin mielestäni paremman. Ja tältä se kuulostaa.
Huomioita Sunon kappaleista
Yllä olevan kappaleen lisäksi kuuntelin muutamia muiden luomia kappaleita sekä kymmenkunta itse luomaani kappaletta. Osa kuuntelemistani ja luomistani kappaleista on tehty jo alkuvuodesta, jolloin käytössä on ollut vasta v2-versio Sunosta. Ensimmäinen huomio on, että kehitystä on tapahtunut paljon. Yllä kuultava kappale kuulostaa jo lähes kokonaiselta kappaleelta. Aloitus ja lopetus ovat vielä vähän huterat. Kappaleen rakennetta saa huomattavasti paremmaksi, jos sen suunnittelee itse ja merkitsee tekstikenttään tarvittavat introt, säkeistöt, kertosäkeet ja välisoitot. Joskus Suno jättää promptista huolimatta intron pois tai tekee erilaiset säkeistöt. Tätä ja muitakin ongelmia voi yrittää ratkaista luomalla uuden kappaleen samalla promptilla.
Tekoälyn tapa on tehdä loogisia arvauksia siitä, mitä seuraavaksi voisi musiikissa tapahtua. Suunnitelmallisuuden ja tekstin merkitysten ymmärtämättömyys tuottaa välillä kummallista musiikkia. Suno ei havaitse välttämättä annetun tekstin lauseita, jolloin fraasirajat ovat mielipuolisissa paikoissa. Toisaalta on paljon ihmistenkin tekemää musiikkia, jossa vahingossa tai tahallaan musiikilliset fraasit ja tekstin lauseet eivät kohtaa. Yksinkertainen sanojen merkitysten mukainen säveltäminen ei myöskään onnistu, sillä tekoäly ei ymmärrä tekstien merkityksiä. Eli esimerkiksi selkeä käännekohta kappaleen tarinassa ei tule huomioiduksi.
Musiikillisesti Suno on selvästi rytmimusiikin maailmassa. Klassista kappaletta ei klassiseksi tunnistanut. Yllä olevan kaltainen peruspoppi ei ole tyylillisesti kaikkein luovinta musiikkia, joten siinä tekoälyn opittu malli toimii hyvin. Suomen kieli taipuu tässä esimerkissä välillä aika hassuihin sanapainoihin. Vaikka englanti on varmasti Sunolle tutumpi kieli, on siinäkin usein kompurointia sanarytmien kanssa. Sointimaailma on vielä keskeneräinen ja välillä jopa niin tukkoinen, ettei sanoista saa kunnolla selvää.
Testasin Sunon tuottamia kappaleita myös satunnaisilla tuttavilla. Täysin taustalla olevana taustamusiikkina kukaan ei kiinnittänyt mitään erityistä huomiota Sunon luomiin kappaleisiin. Tarkemmalla kuuntelulla osan mielestä kappaleet kuulostivat edelleen aivan kelvollisilta, mutta kappaleita kuvailtiin myös muovisiksi ja sattumanvaraisiksi. Tarkemmalla kuuntelulla etenkin enemmän musiikkia harrastaneilta arvosana oli aika kehno.
Hyöty ja haasteet
Mielestäni musiikillisella leikkimisellä on arvo itsessään. Ja mikäpä olisi hauskempaa leikkiä, kuin tehdä leikisti ja nopeasti uusi, kokonainen, soiva kappale. Suno voi myös toimia innoittajana ja aiheiden tuottajana sävellysprosessissa. Sunon tuottamia kappaleita voisi myös analysoida ja saada musiikin teorian opetukseen uudella tavalla käytäntöä mukaan. Niiden avulla voi tutustua uudenlaisiin musiikkityyleihin ja harjaantua huomaamaan, mitkä musiikilliset asiat ylipäätään muodostavat tietyn tyylin.
Lainsäädäntö laahaa perässä, tekoälyn kehittäjät kiitävät edellä. Eri tekoälysovelluksilla on erilaisia sääntöjä siitä, kenelle tekijänoikeudet kuuluvat. Sunon tapauksessa ilmaisversion käyttäjien tuottaman musiikin tekijänoikeudet jäävät Sunolle. Maksullisten versioiden käyttäjät saavat puolestaan oikeudet tuottamiinsa kappaleisiin.
Suno painottaa ehdoissaan, ettei siihen saa syöttää tekstejä, joihin käyttäjälle ei ole oikeuksia. Tätä on toisaalta mahdotonta vahtia, kuten ei muutenkaan voida taata, ettei lauluja kirjoitettaisi tekstin tekijän haluamatta. Ongelmalliseksi tilanne muodostuu varsinkin silloin, jos Suno pullauttaa nämä aiemmin laittomasti sille syötetyt originaalit sanoitukset jonkun muun kappaleeseen, ja väittää koko kappaletta omaksi tekeleekseen. Tämä ehkäpä hypoteettinen tilanne on kuitenkin teoriassa jollain tasolla mahdollinen. Suno myös muistuttaa, että se ei tee välttämättä ainutkertaisia tuotoksia. Jos joku muu sattuu antamaan saman promptin, voi lopputulos olla melko samanlainen.
Miten huolehditaan tekijänoikeuksista ja kenelle ne kuuluvat? Onko laulajalla tekijänoikeudet omaan persoonalliseen ääneensä? Miten jatkossa käy musiikin ammattilaisille; säveltäjille, soittajille, laulajille, äänittäjille, studiomiksaajille? Miksi ylipäätään käytämme musiikkia?
Voi katsoa sinne, missä generatiivinen tekoäly on ollut arkipäivää jo pidempään. Tekstipuolella on ollut jo pidempään olemassa generoivia työkaluja. Toimittaja tarvitaan kuitenkin edelleen tekemään havaintoja ajankohtaisista uutisaiheista. Tekoäly voi tehdä uutisen, tarinan tai vaikka mielipiteen, mutta niiden kaavamaisuus saattaa pistää silmään. Samoin tekoälyn tekemän musiikin laatu on melko ailahtelevaa. Taustamusiikkina käytettävän tuotantomusiikin tämänkaltainen palvelu saattaa peitota. Live-musiikki ja musisointitaidot saattavat nousta arvoasteikossa, koska kuka tahansa ei pysty esittämään musiikkia, vaikka voisikin tuottaa sitä äänitiedostoksi.
Luottaisin toistaiseksi siihen, että jos on tarkoitus tehdä ihmistä koskettavaa ja puhuttelevaa musiikkia, on ihminen edelleen huomattavasti parempi tässä hommassa. Jos on tarkoitus vain täyttää korvat jollain äänimassalla, siihen tarkoitukseen voi käyttää aivan hyvin tekoälyä. Toisaalta voidaankin kysyä, mitä lisäarvoa sellainen ääni tuo elämäämme ja pärjäisimmekö paremmin ilman? Kaiken kaikkiaan tekoälyn kehitys on tällä hetkellä niin nopeaa, ettei kukaan voi ennustaa, missä ollaan vuoden, kahden tai viiden vuoden kuluttua.
Lähteet
Generative artificial intelligence. 2024. Verkkosivu. Viitattu 3.6.2024. https://en.wikipedia.org/wiki/Generative_artificial_intelligence.
Suno. 2024. Verkkosivu. Viitattu 3.6.2024. https://suno.com/.
Yksi vastaus aiheeseen “Suno.ai – tekoäly tehtailee kappaleen”
Hyvä