Yep, het is zover. Ik kan niet achterblijven, toch? AI, en wat ik ervan denk … Niet dat je erom gevraagd hebt, maar AI is overal. En ik word er op aangesproken. Vorige week werd ik nog gequote in een artikel op VRT NWS.
Ik ga eerlijk zijn. Mijn kijk op AI is de voorbije 18 maanden 180 graden gekeerd: van ‘ik was er gewoon niet mee bezig’ naar … expert? Nee, geïnformeerd en genuanceerd. Ik heb gelezen, beluisterd, onderzocht en geëxperimenteerd. En - bron van mijn ongerustheid trouwens - het is moeilijk om een genuanceerd beeld te schetsen. Dit is mijn poging. Stick with me.
Als stemacteur en producer heb ik Artificiële Intelligentie de voorbije anderhalf jaar echt omarmd. Want dat is wat je doet als vakman: nieuw gereedschap ontdekken, uitproberen, inzetten waar het nuttig is. Ondertussen is het quasi dagelijks nieuw speelgoed in mijn toolbox. Letterlijk zelfs: ik gebruik AI als ik aan mijn motor zit te sleutelen in de garage. Echt! Ik zie het niet als de magische alleskunner die al onze problemen oplost. Maar het is óók niet de catastrofale ramp die ons allemaal werkloos gaat maken. Eigenlijk is het best ‘normale’ technologie. Gereedschap dat me in deze uitdagende tijden een betere vakman maakt.
De illusie van achterstand
Maar eerst het slechte nieuws. Er wordt zoveel gezegd, geschreven en ge-podcast over AI dat het je oren uitkomt. En hoewel de verslaggeving de laatste maanden wat aan realiteit en nuance lijkt te winnen, worden de grote claims niet geschuwd: AI is tegelijk de grootste catastrofe met massale werkloosheid tot gevolg [loodgieters blijven blijkbaar nog even gespaard] en “AI gaat alle facetten van ons leven verbeteren”. En vooral, als [creatieve] ondernemer mag je de boot zeker niet missen. Want dan blijf je onherroepelijk achter! [niet mijn woorden voor alle duidelijkheid]. Maar is dat wel zo? Wie zegt dat?
Een voorbeeld over luisterboeken, maar het gaat evengoed op voor ander stemmenwerk. Verschillende mensen stuurden mij het artikel “Publishers Must Take Advantage of Growing Audio Market, Often with AI” . Het idee: met artificiële stemmen snel en goedkoop de ‘achterstand’ aan titels wegwerken en de markt doen groeien.
Laten we wel wezen: er knaagt iets aan dat verhaal. Het klinkt als muziek in mijn oren, zeker voor de Vlaamse luisterboekenmarkt, maar er is momenteel niks snel, efficiënt of goedkoop aan het produceren van kwaliteitsvolle Nederlandstalige luisterboeken met een tool zoals ElevenLabs [de bekendste AI-stemgenerator van het moment]. Misschien ligt het voor Engels- of Spaanstalige titels net wat anders, maar de investering in tijd en geld is vaak groter dan de echte-mensen-manier én voor een eindresultaat dat zonder twijfel van mindere kwaliteit is. Ik kan het weten. Ik zit aan de bron.
Voor wie is de winst?
Ik zie de winst niet. Niet als producent of stemacteur. Voor de uitgeverijen? De auteurs? Volgens mij niet. Voor wie dan wel? De spelers die – net als in dat artikel – AI het hardst toejuichen en ons de noodzaak ervan willen doen inzien, zijn technologiebedrijven, big tech. En ik kan het ze niet kwalijk nemen: het verdienmodel van streaming draait op inkomsten uit abonnementen en een onstilbare honger naar content: zo veel en zo regelmatig mogelijk. Kwantiteit boven kwaliteit. Klassiek. En AI is simpelweg de goedkoopste manier om die content-pijplijn te blijven vullen.
In het commerciële stemmenwerk zie je trouwens dezelfde dynamiek, maar dan gedreven door een drang naar hyper-personalisatie en A/B-testing. Eén ijzersterke karaktervolle commercial is niet genoeg; algoritmes vragen 100 varianten van een online video om te zien what sticks. Ook daar ontgaat mij de winst voor de consument, voor het merk of voor de marketeer. Ook hier dicteren algoritmes het verdienmodel: niet de krachtige emotionele overtuigingskracht van één perfect geregisseerde take, maar de datagedreven kwantiteit van duizenden matige takes.
Diezelfde platformen bepalen ook wat we te horen en te zien krijgen over de ongeziene voordelen van Artificiële Intelligentie. Begrijp me niet verkeerd. Ik bedoel het niet in een samenzweerderige of complot-theorie-achtige manier. Het is de huidige economische realiteit die zorgt voor de dwingende illusie van achterstand, efficiëntie, hyper-personalisering en de angst dat je onherroepelijk achterblijft als je niet meedraait in het volume-model.
Het kapotte verdienmodel
Het verdienmodel van kwalitatieve audio hapert. Maar misschien niet zoals je denkt. Dat podcastmakers meestal geen vergoeding krijgen op streaming-platformen is het meest schrijnende voorbeeld. Dat het zoveel podcastmakers wél lukt, is ook weer een voorbeeld van onze flexibiliteit trouwens. It’s not all bad!
Laat het me concreet maken met luisterboeken: in het huidige streamingmodel levert een luisterboek een uitgeverij gemiddeld € 0,27 op per beluisterd uur. Voor een doorsnee luisterboek van zeven uur is dat dus een schamele € 1,89. Op voorwaarde - en dat is toch belangrijk - dat je luisteraar het boek integraal beluistert! Ter vergelijking: op een fysiek papieren boek verdient diezelfde uitgeverij tussen de €6 en €15, nog voor er ook maar één bladzijde gelezen is. Dat verschil is gi-gan-tisch.
In een kleine markt zoals Vlaanderen zet dit verdienmodel de kwaliteit zwaar onder druk. Als de opbrengst bijna nul is, moeten de productiekosten - volgens big tech - ook bijna nul zijn. Dát is de echte reden waarom AI zo gepusht wordt. Investeren in een ambachtelijke, menselijke productie is financieel een uitdaging geworden. Maar wel een die ik graag aanga. [Of wat had je gedacht?]
Het Menselijk Monopolie
Bon. Het goede nieuws dan? Want je zou voor minder depressief en bang worden. Terecht. Artificiële Intelligentie wordt gepusht door big tech, niet omdat het [artistiek] beter is of omdat ons leven gemakkelijker maakt, maar om het huidige economische [streaming]model van een paar gigantische bedrijven te dienen. En onderweg lijkt het menselijke vakmanschap onbetaalbaar te worden. Maar is dat ook zo?
AI faalt fundamenteel op één vlak: het is geen mens. Het blijft een normale technologie. Een heel straffe technologie, dat wel. Maar het zal ons - mensen - nooit vervangen. Niet omdat het ‘niet goed genoeg’ zou zijn, maar eenvoudigweg … omdat het geen mens is. Wij zijn immers een aardig beestje: we zijn biologisch geprogrammeerd om met, voor en tussen andere mensen te leven. In ons eentje worden we - over het algemeen - knettergek. Onze voelsprieten zijn bovendien al eeuwenlang getraind. We zijn meesters in aanvoelen als iets niet in orde is. En net daarvoor is zelfs een term bedacht. In de robotica noemen ze dat de ‘uncanny valley’: dat griezelige onbehagen wanneer iets niet-menselijk zo realistisch is dat de kleine gebreken ons onbewust doen twijfelen.
In audio is dat niet anders. We houden van een echte stem omdat we een glimlach in een stem horen, de onmerkbare ademhaling voor een cruciale zin of de aarzeling die spanning opbouwt. Het is net dankzij de gebreken dat het ons raakt, niet ondanks.
AI as Normal Technology
Meer en meer wetenschappers bestuderen AI en hebben dikwijls een heel genuanceerde blik op die nieuwe technologie. Professor Arvind Narayanan en doctoraatstudent Sayash Kapoor, beiden verbonden aan Princton University, schreven een paper [hier helemaal te lezen] waarin ze AI omschrijven als een 'normale' technologie en dat we die ook zo moeten bekijken.
Geen zin om een [lange] paper te lezen? De heren leggen het ook uit en gaan in gesprek met Adam Conover in deze podcast op Yutube: Debunking AI’s “Existential Risk”. De moeite om te beluisteren.
De vakman slaat terug
Hoe meer technologische optimalisatie een rol speelt, hoe belangrijker het wordt te kijken naar wat die technologie voor ons - mensen - betekent. Hoe het ons kan blijven verbinden.
Net daar zit een geweldige kans voor mij als stemacteur en producer. De technologische evolutie, met AI op kop, maakt dat ik nu zoveel insanely knap gereedschap ter beschikking heb om mijn ambacht beter te maken. Ik ben nog steeds de kapitein, mijn schip is alleen wat sneller geworden. Ik geef een paar voorbeelden hoe ik AI vandaag als ‘normale technologie’ inzet of ermee experimenteer, want niet alles is nu al professioneel inzetbaar.
Om te beginnen - en best eenvoudig en toegankelijk - als sparringpartner. De combinatie van logica en taal in een large language model is absoluut verbijsterend. Niet alleen geeft Gemini [wat ik vooral gebruik] mij - in tegenstelling tot waar we dikwijls schrik voor hebben - ontzettend accurate en juiste informatie, het helpt mij bij het ordenen van mijn gedachten, het uitwerken van ideeën of - yep - in mijn garage bij het onderhouden en herstellen van mijn vintage motor.
Niet dat Gemini nooit fout is, maar de antwoorden hangen zo erg af van wat ik vraag, welke input ik geef. Goed worden in het formuleren van vragen, van context voorzien, in “prompten” dus. Het is een vaardigheid die ik heb moeten leren, die ik moet oefenen en onderhouden. Tjiens, net zoals je dat doet met een instrument of een nieuw stuk fysiek gereedschap.
Maar ook specifiek voor audio. Onze hedendaagse standaard audiosoftware voor het verwijderen van achtergrondruis en mondgeluidjes, voor het masteren van audio, kortom om je luisterboeken, podcasts, muziek en documentaires écht goed te laten klinken. Die software steunt ongelooflijk op AI-modellen en Machine Learning. Ook al valt dat niet onmiddellijk op.
Neem bijvoorbeeld de goed ingeburgerde plugins van iZotope RX bijvoorbeeld. Al in 2017, bij de release van RX6, begon iZotope zijn algoritmes actief te trainen om audioproblemen te detecteren. Fast forward naar RX11 [gelanceerd in mei 2024] dat helemaal doordrongen is van state-of-the-art neurale netwerken die op de achtergrond en in real-time achtergrondruis of galm wegfilteren. Tijdens het bewerken neemt dat algoritme tot wel 100.000 beslissingen per seconde over de audio. Achter de schermen is die technologie duizelingwekkend, maar op het scherm is het gewoon een ijzersterk stuk gereedschap dat mij sneller en beter laat werken.
En tenslotte - de olifant in de kamer - kan ik artificiële stemmen en Eleven Labs niet onbenoemd laten. Voor de duidelijkheid: ik heb hier vandaag nog geen commerciële toepassing voor gevonden. Dat is geen excuus of om mezelf in te dekken. De technologie is - in vergelijking met échte stemmen én voor het Vlaams - gewoon nog niet goed genoeg. Maar het is wél verbazingwekkend wat er al kan.
Ga maar eens luisteren [de player staat bovenaan deze pagina]. Ik heb dit artikel helemaal voor je ingelezen. Maar - spoiler alert - je zult mij niet horen. Of toch? Je hoort mijn alter ego Axelle Isebaert. Ze bestaat niet echt. Ik heb haar gemaakt. Maar hoe dan? Geen ‘voice-cloning’ en ‘text-to-speech’ [waarbij je iemand eender wat kan laten zeggen]. Die technologie is echt ontoereikend en vraagt bovendien ontzettend veel werk om het redelijk te laten klinken. Wel ‘speech-to-speech’ met een artificieel ‘gebouwde’ stem. Mijn ervaring, mijn talent én mijn vakmanschap. Versterkt met AI. Maar ook met mijn gebreken en eigenaardigheden [zoals mijn huig-R bijvoorbeeld]. Artificiële intelligentie heeft mij niet vervangen. Integendeel. Het heeft me verbeterd.
Ik kies … om niet bang te zijn
We leven in een uiterst ingewikkelde en overweldigende wereld vandaag. Terecht beangstigend. Maar je kan het ook naar je hand zetten. De combinatie van technologie, talent, kennis en gezond verstand maakt dat wij - mensen in het algemeen, creatieve ondernemers in het bijzonder - die uitdagingen best aankunnen. Dat we bijvoorbeeld wel nog rendabel luisterboeken of commercials kunnen maken én verkopen. Hoe? Door te focussen op authenticiteit [wat dacht je?], op échte verhalen en échte stemmen. Op verbinding. Focussen op ‘premium content’ en alternatieve distributie [in plaats van blind mee te gaan in de goedkope contentdrift].
Dat Vlaanderen een kleine markt en taalgebied is, wordt dan plots een sterkte. We moeten niet concurreren op volume met Silicon Valley, maar op onvervangbare, lokale kwaliteit. Geholpen - en niet vervangen - door die adembenemende spannende nieuwe ‘normale’ technologie.
PS/ Ik ben me ervan bewust dat ik topics zoals de milieu-impact, auteursrechten en desinformatie niet heb aangeraakt. Niet omdat ze me niet verontrusten, maar omdat het zo al ingewikkeld genoeg is …
"De pot op met hun soort. Gedaan
Met hun dikdoenerij, hun dof
En byzantijns gedaas. En dat
Bevel geldt ook voor u — u die
Dit leest. Of u die luistert, als dit u
Wordt toegeschreeuwd of ingefluisterd."
Ik doe al mijn werk graag, echt! Maar af en toe passeert er een project waar je nét dat ietsje trotser op bent ...
Eind vorig jaar vroeg Tom Lanoye of ik de luisterboekversie van zijn 'ReinAard: Schelmenroman' voor mijn rekening wou nemen. Duh. Ingelezen door Tom Lanoye zelf natuurlijk, met originele en geweldige muziek van Michiel Los, Charel Maes, Ruben Verbeeck en Simon Pas. De editing was in handen van Stijn Debontridder.
Te beluisteren op alle gangbare platformen, waaronder:
Gaat dat luisteren!