Du jour où le téléphone a été inventé, des esprits ingénieux ont relevé que le micro constituait un détecteur de son susceptible d'envoyer un signal électrique au moindre bruit. D'où l'idée d'envoyer ce message à la machine pour qu'elle obéisse à la voix. En 1952, un premier appareil capable de reconnaître à la voix les chiffres, de 0 à 9, est présenté à New York.
Techniquement, la reconnaissance vocale est une technologie de transcription d'un système phonatoire exploitable par une machine. La reconnaissance vocale a principalement évoluée durant les années 70 à 90, notamment grâce aux travaux d'IBM.
De nos jours, la reconnaissance vocale se représente sous différents aspects :
- La dictée vocale, la retranscription
- La commande vocale
- La recherche d'information, permettant de retrouver des informations de nature vocale dans une masse de données.
(...)
[...] - Système public ou professionnel? - Utilisateur habitué au système? En conclusion, les systèmes de reconnaissance vocale ne sont pas capables aujourd'hui de prendre en compte tous ces facteurs simultanément avec un taux d'erreur très faible. Pour notre expérience, nous avons programmé un système de reconnaissance vocale sous Matlab, permettant la reconnaissance de mots isolés avec une taille de vocabulaire de 20 mots. On a ensuite étudié sa robustesse à différents facteurs que sont: - Le changement de locuteur - Le changement d'environnement - De plus, notre technique de programmation par déformation temporelle dynamique que l'on expliquera, permet de corrigé le facteur de la vitesse d'élocution. [...]
[...] C'est en comparant les scores de toutes les références que l'on trouve le mot le plus proche. III) Resultats. %montrer transparent des résultats %Le tableaux représentent les résultats pour les mots Châtellerault et Nice A gauche, on a les échantillons correspondant au locuteur 0 et au bruit en haut, les échantillons correspondant au locuteur 0 avec bruit ainsi que les autres enregistrements sonores (locuteur avec bruit 3). %expliquer les codes se couleur du transparent (vert/rouge) Les mots qui se ressemblent admettent des scores proches. [...]
[...] Principe et exploitation de la DTW Le programme 2 utilise le technique DTW (Dynamics Time Warping) ce qui signifie déformation temporelle dynamique. On a donc une matrice test et une matrice de référence à comparer. Le programme 2 que nous avons écrit compare les vecteurs colonnes 2 à 2. Cela permit de créer une matrice où figure les distances euclidiennes entre chaque colonne Pour bien expliquer le principe, nous avons réalisée l'expérience décrite ici avec le mot bonjour Le programme 1 nous donne la matrice des coefficients cepstraux associé aux différents phonèmes du mot. [...]
[...] Nous avons ainsi tenté de répondre à la question : Dans quelle mesure les systèmes de reconnaissance vocale par programmation dynamique résistent-ils aux éléments de variabilité? Ce TIPE repose sur la conception et l'étude de robustesse d'un système de reconnaissance vocale qui permet la reconnaissance par ordinateur de l'énonciation de chiffres et de différents noms de villes que l'on précisera. %présentation du plan Topologie du système de reconnaissance de la parole Il y a 5 éléments de variabilité majeurs à prendre en compte pour qu'un système de reconnaissance vocale ait un taux d'erreur faible. [...]
[...] Le but du système est de reconnaître le mot prononcé par un locuteur par comparaison aux fichiers de référence. %montrer sur schéma global : On compare le fichier à tester aux vingt fichiers de référence. Le programme nous permet de déterminer quel signal de référence est le plus proche du signal test. %montrer photos d'expériences : Voilà le matériel utilisé: un micro, un ordinateur muni du logiciel Matlab et d'une interface d'enregistrement et un ventilateur. %montrer sur schéma global La comparaison est effectuée grâce au programme 2. Il est cependant nécessaire d'effectuer une transformation préalable du signal sonore. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture