| ID Notice | 13163 |
| Domaine | Monographie |
| Type document | étude, rapport, synthèse |
| Titre propre | La parole : compréhension et synthèse par les ordinateurs |
| Titre collection | Le physicien |
| Auteurs | auteur, Guibert Jean |
| Editeurs | Presses universitaires de France |
| Date de parution | 1979 |
| Langue | français |
| Descripteurs | informatique ; langage ; ordinateur ; physique |
| Résumé éditeur | Nous savions l'ordinateur capable d'effectuer à des vitesses vertigineuses des opérations qui exigeraient de l'homme des années de travail ; mais nous le pensions tout juste susceptible de recevoir des ordres sous forme de signaux visuels. Or la voix humaine dont les nuances et les variétés nous semblent infinies peut se ramener à un nombre très restreints de données caractéristiques. La parole peut être désormais perçue et émise par des ordinateurs. C'est dire qu'il existe des machines capables d'exécuter des ordres donnés oralement et de "dire" le résultat des calculs qu'elles ont effectués; dès à présent la machine sait opérer la transposition du langage de l'oral à l'écrit et de l'écrit à l'oral aussi bien que l'identification d'une personne par sa voix. Demain, au lieu de dicter une lettre à votre secrétaire, vous la dicterez à un ordinateur. Votre fiche de police comportera votre empreinte vocale. Vous pourrez demander par téléphone l'état de votre compte en banque : une machine vous reconnaîtra aussitôt. On imagine le gain de temps dans tous les domaines que peut occasionner l'application d'une telle découverte. Dans une société bien faite, le temps de loisir et de culture s'en trouvera accru d'autant. Jean GUIBERT, ancien élève de l'Ecole Normale Supérieure, agrégé de sciences physiques et docteur ès sciences, est actuellement chercheur au département de Radioastronomie de l'Observatoire de Paris-Meudon. Pendant plusieurs années, il a travaillé au Centre de Recherches de la Compagnie Générale d'Electricité dans le domaine de la synthèse et de la reconnaissance de la parole par ordinateur, et participé à la conception de systèmes de communication vocale homme-machine. |
| Sommaire | PRÉFACE d'Alfred KASTLER 21 AVANT-PROPOS 25 PREMIÈRE PARTIE : QU'EST-CE QUE LA PAROLE ? CHAPITRE PREMIER. L'Ecole des Ordinateurs 29 CHAPITRE II. Généralités sur les phénomènes vibratoires 38 II. 1. Notions fondamentales sur le son et les vibrations 38 II. 2. Décomposition d'un phénomène vibratoire complexe 43 II. 3. Filtres 47 II. 4. Echantillonnage et codage d'un signal 52 CHAPITRE III. Qu'est-ce que la parole ? 57 III. 1. L'appareil phonatoire: description sommaire 57 III. 2. Principe de fonctionnement de l'appareil phonatoire 58 III. 3. Excitation du système phonatoire 59 III. 4. Stabilité et évolutions de la configuration du conduit vocal 61 III. 5. Le timbre de la voix et les formants 62 CHAPITRE IV. L'analyse de la parole 65 IV. 1. Visualisation et enregistrement du signal de parole 65 IV. 2. L'analyse spectrale de la parole 66 IV. 3. L'analyse de type temporel 75 IV. 4. La détermination du fondamental 79 IV. 5. La recherche des formants 83 DEUXIÈME PARTIE : LES ORDINATEURS PARLENT CHAPITRE V. La synthèse de la parole: historique et généralités 89 V. 1. Qu'est-ce que la synthèse de parole ? 89 V. 2. Bref historique de la synthèse de parole 90 V. 3. Vue d'ensemble sur les diverses techniques de synthèse 94 CHAPITRE VI. Synthétiseurs à canaux 99 VI. 1. Le vocodeur à canaux. Description générale et fonctionnement 99 VI. 2. Vocodeurs à circuits analogiques et vocodeurs numériques 102 VI. 3. Autres types de synthétiseurs à canaux 102 CHAPITRE VII. Synthétiseurs à formants 104 VII. 1. Présentation du synthétiseur à formants « série » 104 VII. 2. L'analyse de la parole et l'extraction des paramètres de commande 108 VII. 3. Mise en uvre de la synthèse. Synthèses par mots, par diphonèmes, par règles 108 VII. 4. Synthétiseurs à formants « parallèle » 109 VII. 5. Comparaison des synthétiseurs à canaux et à formants 110 CHAPITRE VIII. Synthèse de parole par simulation du conduit vocal 112 VIII. 1. Approche acoustique 112 VIII. 2. Approche électrique 114 VIII. 3. Mesure de la fonction d'aire du conduit vocal 118 VIII. 4. Exemples d'études et de réalisations. Perspectives 120 CHAPITRE IX. Synthèse prédictive 122 IX. 1. Rappel du principe de la prédiction linéaire 122 IX. 2. Mise en uvre de la synthèse prédictive 122 IX. 3. Influence du nombre de coefficients de prédiction sur la qualité de la synthèse 124 IX. 4. Complémentarité de diverses techniques d'analyse et de synthèse 124 CHAPITRE X. De la synthèse par éléments préenregistrés à la synthèse par règles 126 X. 1. Synthèse par assemblage d'éléments préenregistrés 126 X. 2. Synthèse par règles phonémiques. Théorie du « locus » 128 X. 3. Synthèse par règles subphonémiques 130 X. 4. Modélisation des règles de transition en synthèse à formants 133 X. 5. Synthèse par règles articulatoires 133 X. 6. Intonation, rythme, intensité: paramètres prosodiques 135 X. 7. Rôle des contextes syntaxique et sémantique en synthèse de parole 137 X. 8. Conclusion: avenir de la synthèse par règles 138 CHAPITRE XI. Intelligibilité et naturel de la parole synthétique 140 XI. 1. Définition et intérêt de quelques notions 140 XI. 2. Facteurs influençant l'intelligibilité, le naturel, et le caractère personnel de la parole synthétique 142 XI. 3. Intelligibilité et naturel des synthétiseurs à canaux et à formants 144 XI. 4. Evaluation des qualités de la parole synthétique 146 XI. 5. Choix du matériel phonétique. Sélection des auditeurs 148 TROISIÈME PARTIE : LES ORDINATEURS ENTENDENT CHAPITRE XII. L'oreille et l'audition 153 XII. 1. Description du système auditif 153 XII. 2. Réponse du système auditif aux signaux sonores. Rôles de l'intensité et de la fréquence des sons 155 XII. 3. Fonctionnement de l'appareil auditif et théories de l'audition 157 CHAPITRE XIII.La perception de la parole 162 XIII. 1. Les unités perceptuelles 162 XIII. 2. Les théories de la perception de la parole 162 XIII. 3. Paramètres de la parole et perception 164 XIII. 4. Analyse multidimensionnelle de la parole 165 XIII. 5. Normalisation dans la perception de la parole 171 XIII. 6. Redondance du langage et rôle des contextes dans la perception 171 CHAPITRE XIV. Intelligence artificielle et reconnaissance des formes 174 XIV. 1. Introduction : perception, reconnaissance des formes, classifications 174 XIV. 2. Domaines d'application de la reconnaissance des formes : du tri postal au diagnostic médical 176 XIV. 3. Description de la forme et prétraitement 178 XIV. 4. La machine à décision optimale. Fonctions discriminantes et surfaces séparatrices 179 XIV. 5. Fonctions discriminantes quadratiques. Exemples des distributions gaussiennes 181 XIV. 6. Les classificateurs linéaires 184 XIV .7. L'analyse discriminante linéaire 187 XIV. 8. Perceptions et machines à décision majoritaire 189 CHAPITRE XV.L'ordinateur apprend à reconnaître les formes 191 XV. 1. Les divers types d'apprentissage 191 XV. 2. Les méthodes d'apprentissage supervisé 192 XV. 3. Les algorithmes évolutifs 195 XV. 4. Les méthodes d'apprentissage non supervisé 196 CHAPITRE XVI. Reconnaissance automatique de la parole. Une première étape : la reconnaissance des mots isolés 199 XVI. 1. Généralités sur la reconnaissance de parole 199 XVI. 2. La description du signal de parole 205 XVI .3. Reconnaissance analytique et segmentation phonémique 207 XVI .4. Apprentissage, adaptation, normalisation 213 XVI. 5. Réalisations actuelles et perspectives 216 CHAPITRE XVII.Compréhension automatique de la parole continue. Analogies avec la traduction automatique. Les langages artificiels 218 XVII. 1. La compréhension automatique 218 XVII. 2. Compréhension et traduction automatiques 222 XVII. 3. Les langages artificiels 223 XVII. 4. Premières réalisations en compréhension automatique 226 CHAPITRE XVIII. Identification, discrimination et vérification de locuteurs XVIII. 1. Position du problème 228 XVIII. 2. Comparaison auditive des voix 231 XVIII. 3. Comparaison visuelle des sonagrammes 232 XVIII. 4. Caractérisation automatique des locuteurs 233 XVIII. 5. Conclusion 235 QUATRIÈME PARTIE : ORDINATEURS ET COMMUNICATION PARLÉE CHAPITRE XIX. Analyse, synthèse et reconnaissance de la parole au service des télécommunications 239 XIX. 1. La parole naturelle et son transport 239 XIX. 2. Théorie de l'information et redondance de la parole naturelle 241 XIX. 3. Compression du signal vocal analogique 244 XIX. 4. Transmission numérique de la parole naturelle 245 XIX. 5. Analyse-synthèse et transmission de la parole 247 XIX. 6. Reconnaissance de parole et télécommunications 250 XIX. 7. Conclusion : l'ordinateur et le téléphone 250 CHAPITRE XX. Téléinformatique et dialogue avec les ordinateurs252 XX. 1. Introduction : évolution de l'informatique 252 XX. 2. La téléinformatique (ou télématique) 253 XX. 3. Télégestion et contrôle à distance des processus industriels 258 XX. 4. La communication orale homme-machine : avantages et limitations actuelles 259 XX. 5. Les premiers terminaux vocaux d'ordinateurs : programmation, calcul et gestion bancaire informatisée par téléphone 262 CHAPITRE XXI. Diffusion des connaissances, enseignement, formation continue 264 XXI. 1. Circulation et vulgarisation des connaissances 264 XXI. 2. L'ordinateur, l'enseignement et la formation continue 267 XXI. 3. Qu'apportera la communication parlée avec les ordinateurs ? 271 CHAPITRE XXII. Les aides aux handicapés 275 XXII. 1. Introduction : les divers handicaps et leurs conséquences 275 XXII. 2. Les aides à la cécité 276 XXII. 3. Les aides aux malentendants 281 XXII. 4. Les aides aux handicapés moteur 287 XXII. 5. Conclusion 287 CHAPITRE XXIII. Faciliter la vie quotidienne 289 XXIII. 1. Le terminal vocal : un esclave à tout faire 289 XXIII. 2. Renseignements téléphoniques, météorologie, circulation routière 291 XXIII. 3. Commandes et réservations de places 293 XXIII. 4. Signature et empreintes vocales 293 XXIII. 5. Médecine et santé 295 XXIII. 6. La vie sous la mer et le problème de la « voix dans l'hélium » 297 XXIII. 7. Conclusion : énergie, pollution, télécommunications 300 CHAPITRE XXIV.Aspects psychologiques, politiques, économiques et sociaux 301 XXIV. 1. Aspects psychologiques 302 XXIV. 2. Aspects politiques : « mass media », informatique et libertés 303 XXIV. 3. Espionnage économique et transmission de données 306 XXIV. 4. Evolution des emplois et problèmes sociaux 307 BIBLIOGRAPHIE 311 INDEX 313 |