• Accueil
 
Écrits résultats de votre recherche
ID Notice 13163
Domaine Monographie
Type document étude, rapport, synthèse
Titre propre La parole : compréhension et synthèse par les ordinateurs
Titre collection Le physicien
Auteurs auteur, Guibert Jean
Editeurs Presses universitaires de France
Date de parution 1979
Langue français
Descripteurs informatique ; langage ; ordinateur ; physique
Résumé éditeur Nous savions l'ordinateur capable d'effectuer à des vitesses vertigineuses des opérations qui exigeraient de l'homme des années de travail ; mais nous le pensions tout juste susceptible de recevoir des ordres sous forme de signaux visuels. Or la voix humaine dont les nuances et les variétés nous semblent infinies peut se ramener à un nombre très restreints de données caractéristiques. La parole peut être désormais perçue et émise par des ordinateurs. C'est dire qu'il existe des machines capables d'exécuter des ordres donnés oralement et de "dire" le résultat des calculs qu'elles ont effectués; dès à présent la machine sait opérer la transposition du langage de l'oral à l'écrit et de l'écrit à l'oral aussi bien que l'identification d'une personne par sa voix. Demain, au lieu de dicter une lettre à votre secrétaire, vous la dicterez à un ordinateur. Votre fiche de police comportera votre empreinte vocale. Vous pourrez demander par téléphone l'état de votre compte en banque : une machine vous reconnaîtra aussitôt. On imagine le gain de temps dans tous les domaines que peut occasionner l'application d'une telle découverte. Dans une société bien faite, le temps de loisir et de culture s'en trouvera accru d'autant.

Jean GUIBERT, ancien élève de l'Ecole Normale Supérieure, agrégé de sciences physiques et docteur ès sciences, est actuellement chercheur au département de Radioastronomie de l'Observatoire de Paris-Meudon. Pendant plusieurs années, il a travaillé au Centre de Recherches de la Compagnie Générale d'Electricité dans le domaine de la synthèse et de la reconnaissance de la parole par ordinateur, et participé à la conception de systèmes de communication vocale homme-machine.
Sommaire PRÉFACE d'Alfred KASTLER 21
AVANT-PROPOS 25

PREMIÈRE PARTIE : QU'EST-CE QUE LA PAROLE ?
CHAPITRE PREMIER. L'Ecole des Ordinateurs 29
CHAPITRE II. Généralités sur les phénomènes vibratoires 38
II. 1. Notions fondamentales sur le son et les vibrations 38
II. 2. Décomposition d'un phénomène vibratoire complexe 43
II. 3. Filtres 47
II. 4. Echantillonnage et codage d'un signal 52
CHAPITRE III. Qu'est-ce que la parole ? 57
III. 1. L'appareil phonatoire: description sommaire 57
III. 2. Principe de fonctionnement de l'appareil phonatoire 58
III. 3. Excitation du système phonatoire 59
III. 4. Stabilité et évolutions de la configuration du conduit vocal 61
III. 5. Le timbre de la voix et les formants 62
CHAPITRE IV. L'analyse de la parole 65
IV. 1. Visualisation et enregistrement du signal de parole 65
IV. 2. L'analyse spectrale de la parole 66
IV. 3. L'analyse de type temporel 75
IV. 4. La détermination du fondamental 79
IV. 5. La recherche des formants 83

DEUXIÈME PARTIE : LES ORDINATEURS PARLENT
CHAPITRE V. La synthèse de la parole: historique et généralités 89
V. 1. Qu'est-ce que la synthèse de parole ? 89
V. 2. Bref historique de la synthèse de parole 90
V. 3. Vue d'ensemble sur les diverses techniques de synthèse 94
CHAPITRE VI. Synthétiseurs à canaux 99
VI. 1. Le vocodeur à canaux. Description générale et fonctionnement 99
VI. 2. Vocodeurs à circuits analogiques et vocodeurs numériques 102
VI. 3. Autres types de synthétiseurs à canaux 102
CHAPITRE VII. Synthétiseurs à formants 104
VII. 1. Présentation du synthétiseur à formants « série » 104
VII. 2. L'analyse de la parole et l'extraction des paramètres de commande 108
VII. 3. Mise en uvre de la synthèse. Synthèses par mots, par diphonèmes, par règles 108
VII. 4. Synthétiseurs à formants « parallèle » 109
VII. 5. Comparaison des synthétiseurs à canaux et à formants 110
CHAPITRE VIII. Synthèse de parole par simulation du conduit vocal 112
VIII. 1. Approche acoustique 112
VIII. 2. Approche électrique 114
VIII. 3. Mesure de la fonction d'aire du conduit vocal 118
VIII. 4. Exemples d'études et de réalisations. Perspectives 120
CHAPITRE IX. Synthèse prédictive 122
IX. 1. Rappel du principe de la prédiction linéaire 122
IX. 2. Mise en uvre de la synthèse prédictive 122
IX. 3. Influence du nombre de coefficients de prédiction sur la qualité de la synthèse 124
IX. 4. Complémentarité de diverses techniques d'analyse et de synthèse 124
CHAPITRE X. De la synthèse par éléments préenregistrés à la synthèse par règles 126
X. 1. Synthèse par assemblage d'éléments préenregistrés 126
X. 2. Synthèse par règles phonémiques. Théorie du « locus » 128
X. 3. Synthèse par règles subphonémiques 130
X. 4. Modélisation des règles de transition en synthèse à formants 133
X. 5. Synthèse par règles articulatoires 133
X. 6. Intonation, rythme, intensité: paramètres prosodiques 135
X. 7. Rôle des contextes syntaxique et sémantique en synthèse de parole 137
X. 8. Conclusion: avenir de la synthèse par règles 138
CHAPITRE XI. Intelligibilité et naturel de la parole synthétique 140
XI. 1. Définition et intérêt de quelques notions 140
XI. 2. Facteurs influençant l'intelligibilité, le naturel, et le caractère personnel de la parole synthétique 142
XI. 3. Intelligibilité et naturel des synthétiseurs à canaux et à formants 144
XI. 4. Evaluation des qualités de la parole synthétique 146
XI. 5. Choix du matériel phonétique. Sélection des auditeurs 148

TROISIÈME PARTIE : LES ORDINATEURS ENTENDENT
CHAPITRE XII. L'oreille et l'audition 153
XII. 1. Description du système auditif 153
XII. 2. Réponse du système auditif aux signaux sonores. Rôles de l'intensité et de la fréquence des sons 155
XII. 3. Fonctionnement de l'appareil auditif et théories de l'audition 157
CHAPITRE XIII.La perception de la parole 162
XIII. 1. Les unités perceptuelles 162
XIII. 2. Les théories de la perception de la parole 162
XIII. 3. Paramètres de la parole et perception 164
XIII. 4. Analyse multidimensionnelle de la parole 165
XIII. 5. Normalisation dans la perception de la parole 171
XIII. 6. Redondance du langage et rôle des contextes dans la perception 171
CHAPITRE XIV. Intelligence artificielle et reconnaissance des formes 174
XIV. 1. Introduction : perception, reconnaissance des formes, classifications 174
XIV. 2. Domaines d'application de la reconnaissance des formes : du tri postal au diagnostic médical 176
XIV. 3. Description de la forme et prétraitement 178
XIV. 4. La machine à décision optimale. Fonctions discriminantes et surfaces séparatrices 179
XIV. 5. Fonctions discriminantes quadratiques. Exemples des distributions gaussiennes 181
XIV. 6. Les classificateurs linéaires 184
XIV .7. L'analyse discriminante linéaire 187
XIV. 8. Perceptions et machines à décision majoritaire 189
CHAPITRE XV.L'ordinateur apprend à reconnaître les formes 191
XV. 1. Les divers types d'apprentissage 191
XV. 2. Les méthodes d'apprentissage supervisé 192
XV. 3. Les algorithmes évolutifs 195
XV. 4. Les méthodes d'apprentissage non supervisé 196
CHAPITRE XVI. Reconnaissance automatique de la parole. Une première étape : la reconnaissance des mots isolés 199
XVI. 1. Généralités sur la reconnaissance de parole 199
XVI. 2. La description du signal de parole 205
XVI .3. Reconnaissance analytique et segmentation phonémique 207
XVI .4. Apprentissage, adaptation, normalisation 213
XVI. 5. Réalisations actuelles et perspectives 216
CHAPITRE XVII.Compréhension automatique de la parole continue. Analogies avec la traduction automatique. Les langages artificiels 218
XVII. 1. La compréhension automatique 218
XVII. 2. Compréhension et traduction automatiques 222
XVII. 3. Les langages artificiels 223
XVII. 4. Premières réalisations en compréhension automatique 226
CHAPITRE XVIII. Identification, discrimination et vérification de locuteurs
XVIII. 1. Position du problème 228
XVIII. 2. Comparaison auditive des voix 231
XVIII. 3. Comparaison visuelle des sonagrammes 232
XVIII. 4. Caractérisation automatique des locuteurs 233
XVIII. 5. Conclusion 235

QUATRIÈME PARTIE : ORDINATEURS ET COMMUNICATION PARLÉE
CHAPITRE XIX. Analyse, synthèse et reconnaissance de la parole au service des télécommunications 239
XIX. 1. La parole naturelle et son transport 239
XIX. 2. Théorie de l'information et redondance de la parole naturelle 241
XIX. 3. Compression du signal vocal analogique 244
XIX. 4. Transmission numérique de la parole naturelle 245
XIX. 5. Analyse-synthèse et transmission de la parole 247
XIX. 6. Reconnaissance de parole et télécommunications 250
XIX. 7. Conclusion : l'ordinateur et le téléphone 250
CHAPITRE XX. Téléinformatique et dialogue avec les ordinateurs252
XX. 1. Introduction : évolution de l'informatique 252
XX. 2. La téléinformatique (ou télématique) 253
XX. 3. Télégestion et contrôle à distance des processus industriels 258
XX. 4. La communication orale homme-machine : avantages et limitations actuelles 259
XX. 5. Les premiers terminaux vocaux d'ordinateurs : programmation, calcul et gestion bancaire informatisée par téléphone 262
CHAPITRE XXI. Diffusion des connaissances, enseignement, formation continue 264
XXI. 1. Circulation et vulgarisation des connaissances 264
XXI. 2. L'ordinateur, l'enseignement et la formation continue 267
XXI. 3. Qu'apportera la communication parlée avec les ordinateurs ? 271
CHAPITRE XXII. Les aides aux handicapés 275
XXII. 1. Introduction : les divers handicaps et leurs conséquences 275
XXII. 2. Les aides à la cécité 276
XXII. 3. Les aides aux malentendants 281
XXII. 4. Les aides aux handicapés moteur 287
XXII. 5. Conclusion 287
CHAPITRE XXIII. Faciliter la vie quotidienne 289
XXIII. 1. Le terminal vocal : un esclave à tout faire 289
XXIII. 2. Renseignements téléphoniques, météorologie, circulation routière 291
XXIII. 3. Commandes et réservations de places 293
XXIII. 4. Signature et empreintes vocales 293
XXIII. 5. Médecine et santé 295
XXIII. 6. La vie sous la mer et le problème de la « voix dans l'hélium » 297
XXIII. 7. Conclusion : énergie, pollution, télécommunications 300
CHAPITRE XXIV.Aspects psychologiques, politiques, économiques et sociaux 301
XXIV. 1. Aspects psychologiques 302
XXIV. 2. Aspects politiques : « mass media », informatique et libertés 303
XXIV. 3. Espionnage économique et transmission de données 306
XXIV. 4. Evolution des emplois et problèmes sociaux 307

BIBLIOGRAPHIE 311

INDEX 313