
Microsofts VALL-E imiteert elke stem - drie seconden opname is genoeg

DALL-E wordt opgevolgd door VALL-E: Microsoft en OpenAI hebben een nieuwe kunstmatige intelligentie (AI) gemaakt die stemmen kan imiteren. Een stemopname van slechts drie seconden zou genoeg input moeten zijn voor de AI.
Vandaag weten we het: Wat foto's of video's laten zien, hoeft niet per se gebeurd te zijn. Sinds ChatGPT en DALL-E is het ook duidelijk dat een tekst niet per se uit de pen van een auteur hoeft te komen of een foto uit het penseel van een kunstenaar. Nu is de stem aan de beurt.
Microsoft is zich ervan bewust dat de technologie ook potentieel misbruikt kan worden. Daarom zal een protocol in toekomstige toepassingen ervoor zorgen dat inhoud die door VALL-E is gemaakt als zodanig kan worden herkend.
De AI levert indrukwekkende resultaten met de voorbeelden die Microsoft presenteert. Voor de training werd 60.000 uur aan Engelstalige opnames verwerkt. Dit komt overeen met honderd keer de input van bestaande spraaksyntheses.
Coverafbeelding: shutterstock

De dagelijkse kus van de muze stimuleert mijn creativiteit. Als ze me vergeet, probeer ik mijn creativiteit terug te winnen door te dromen, zodat het leven mijn dromen niet verslindt.
Van de nieuwe iPhone tot de wederopstanding van de mode uit de jaren 80. De redactie categoriseert.
Alles tonen