Alors que ChatGPT continue de changer le paysage du travail créatif, pour le meilleur ou pour le pire, une nouvelle mise à jour de la technologie pourrait permettre au robot de faire bien plus que simplement cracher des mots.
Open AI, la société qui possède et exploite ChatGPT, a annoncé lundi ce son bot pourra bientôt analyser des photos et avoir des conversations audio.
Les utilisateurs peuvent télécharger des photos d’une scène ou d’un objet, puis demander à ChatGPT de parler de ce qu’ils voient et poser des questions sur ce que les photos impliquent grâce à la reconnaissance d’image.
Connexes : ChatGPT : qu’est-ce que c’est et comment ça marche ?
Grâce à ses capacités vocales, ChatGPT imitera les voix et créera des discours après avoir entendu « quelques secondes » de quelqu’un parler.
Open AI a averti que cela pourrait bien sûr entraîner « la possibilité que des acteurs malveillants effraient des personnalités publiques ou commettent des fraudes ». Cependant, la société affirme que ChatGPT ne parlera qu’aux voix déjà présentes dans le système et préalablement approuvées par la société.
« Nous commençons à déployer de nouvelles fonctionnalités vocales et d’image dans ChatGPT. Elles offrent un nouveau type d’interface plus intuitive en vous permettant d’avoir une conversation vocale ou de montrer à ChatGPT de quoi vous parlez », a déclaré Open AI dans un communiqué. publication.
Connexe : La véritable menace de ChatGPT n’est pas l’outil lui-même
Spotify utilise l’intelligence artificielle pour les traductions de podcasts
Spotify est utilise déjà la nouvelle technologie, a annoncé la société cette semaine, pour sa fonction de traduction vocale, qui permettra de traduire des podcasts longs dans d’autres langues tout en utilisant la voix et les inflexions vocales du podcasteur d’origine.
« Cet outil développé par Spotify profite des dernières innovations, dont la nouvelle technologie de génération vocale d’OpenAI, pour s’adapter au style de l’orateur d’origine, créant ainsi une expérience d’écoute plus authentique, plus personnelle et plus naturelle que le doublage traditionnel », a expliqué l’entreprise. dans un communiqué.
Open AI a déclaré que les fonctionnalités de voix et d’image commenceraient à être déployées auprès des utilisateurs de ChatGPT Plus et Enterprise dans les deux prochaines semaines.