Ces "humains IA" permettent aux joueurs de modifier leur voix en temps réel

Une société d’intelligence artificielle en Espagne a dévoilé un certain nombre d' »humains IA » qui permettent aux gens de modifier leur voix dans les jeux vidéo – en temps réel.

Voicemod, qui est basé à Valence, a publié mercredi 20 personnages ressemblant à des humains, allant d’une femme d’une vingtaine d’années à un homme âgé. Les voix sont formées sur des voix d’acteurs professionnels de la voix humaine.

Lors d’une démonstration de la technologie lors d’un appel avec Upreg, le PDG de Voicemod, Jaime Bosch, s’est montré en train de parler régulièrement et de le changer en plusieurs voix différentes, d’une enceinte féminine aiguë à une voix masculine de baryton.

Les joueurs peuvent télécharger l’application sur leur Pomme Mac ou PC Windows et intègrent la technologie de Voicemod en tant que « microphone virtuel » qui se situe entre l’application de microphone qu’ils utilisent pour commencer à parler à travers les personnages alternatifs.

Voicemod, qui compte des talents issus des principales universités techniques de Valence et de Barcelone, travaille sur la synthèse vocale et les fonctionnalités audio interactives depuis 2014, avec de nombreux employés spécialisés dans la technologie musicale et l’audio.

Utilisée par plus de 40 millions de personnes, la technologie de Voicemod peut être utilisée par les personnes de l’application sociale Discord pour se parler avec des voix autres que la leur tout en jouant à des jeux.

« Nous avons une communauté de créativité incroyable qui l’utilise principalement pour s’amuser, en profiter avec ses amis et avoir un sentiment d’appartenance », a déclaré Bosch dans une interview avec Upreg.

« L’un des cas d’utilisation les plus importants que j’aime le plus, ce sont les personnes timides. Certaines personnes nous écrivent pour nous dire que je n’ai pas vraiment pu socialiser avec des personnes qui sont maintenant capables de le faire. »

C’est une étape importante dans le monde de l’IA conversationnelle. Alors que de nombreux algorithmes d’IA d’aujourd’hui permettent aux gens de soumettre du texte et de recevoir en retour quelque chose généré par l’IA, l’exploit de s’assurer que cela est fait en temps réel est beaucoup plus difficile.

La technologie nécessite une puissance de calcul importante. Et la production et le brevetage des modèles d’algorithmes propriétaires sous-jacents nécessitent beaucoup d’investissement et de talent.

À cette fin, Voicemod a levé 23 millions de dollars en espèces auprès de plusieurs investisseurs en capital-risque, dont Leadwind et Bitkraft Ventures.

Bosch n’est pas non plus étranger aux risques liés à l’utilisation abusive de la technologie – la technologie de changement de voix pourrait être utilisée pour imiter des personnalités politiques de premier plan ou arnaquer des personnes, par exemple.

« C’est quelque chose auquel je pense tous les jours, quelque chose auquel nous pensons tous les jours dans l’entreprise en ce qui concerne la création de voix », a-t-il déclaré.

L’entreprise est sur le point de terminer une solution de « filigranage » qui peut identifier si des voix ont été générées à l’aide de systèmes de modification. Il est également en discussion avec d’autres entreprises sur la normalisation de ces systèmes et la garantie que la technologie de changement de voix est diffusée en toute sécurité.

« Une chose est que des lois claires viendront », a déclaré Bosch. « Nous savons que l’Europe y travaille. La réalité est que, généralement, les entreprises vont plus vite que les lois. »

MONTRE: Cannes Lions 2023 : l’IA ne rendra pas les marchés paresseux – PDG de TBWA

A lire également