La reconnaissance visuelle à la rescousse de la reconnaissance vocale
18/09/2003 17h38, par ADIT
Pour faciliter la communication entre l'être humain et l'ordinateur, des systèmes de reconnaissance vocale sont apparus ces dernières années sur le marché. Mais leur fonctionnement reste limité.
Car si la reconnaissance vocale donne de bons résultats dans un bureau, pour une dictée par exemple, elle devient difficile dans un environnement bruyant, en voiture ou dans un hall de gare. Pour augmenter l'efficacité du dispositif, des scientifiques du Centre de Recherche Thomas J. Watson d'IBM (New York) ont donc eu l'idée d'y associer une caméra vidéo.
Cette dernière scrute le visage de la personne qui parle tandis que le système identifie des sons en fonction des informations recueillies : de 12 à 14 sons lorsque la caméra est centrée uniquement sur la bouche et plus lorsqu'on élargit l'observation aux zones périphériques (mâchoire, dents, langue). D'après des tests, qui ne se sont déroulés pour l'instant qu'en studio, la combinaison son/video permet d'accroître de 100% l'efficacité de la reconnaissance vocale.
La reconnaissance visuelle comme suite logique de la reconnaissance vocale a sans doute de beaux jours devant elle.