En phonétique, on appelle voyelle un son du langage humain dont le mode de production est caractérisé par le libre passage de l'air dans les cavités situées au-dessus de la glotte, à savoir la cavité buccale et/ou les fosses nasales. Ces cavités servent de filtres dont la forme et la contribution relative à l'écoulement de l'air influent sur la qualité du son obtenu. L'essentiel des voyelles utilisées dans les langues sont « sonores », c'est-à-dire qu'elles sont prononcées avec une vibration des cordes vocales, le chuchotement utilise – par définition – des voyelles sourdes.
Les voyelles sont opposées aux consonnes, car ces dernières se caractérisent par une obstruction au passage de l'air. D'un point de vue perceptif, les voyelles se manifestent par des sons « clairs » tandis que les consonnes se caractérisent par des bruits tels qu'un chuintement, un sifflement, un roulement, un claquement, etc. Par ailleurs, la voyelle sert généralement de sommet à la syllabe tandis que les consonnes ne jouent généralement pas ce rôle. On notera cependant que certaines consonnes ne produisent pas de bruit caractéristiques d'une consonne et présentent une faible obstruction au passage de l'air : ce sont les spirantes centrales, appelées semi-voyelles (par exemple : [w] dans oui qui se rapproche de [y] dans hue). Certaines consonnes liquides telles que le [r] roulé ou le [l] peuvent servir de sommet d'une syllabe ; elles sont dites alors vocalisées.
En phonétique, les voyelles sont étudiées d'un point de vue articulatoire, acoustique et (ou) auditif.
Approche articulatoire
Les voyelles peuvent être définies par la façon dont elles sont produites articulatoirement. La classification des voyelles des langues naturelles dans l'Alphabet Phonétique International s'appuie sur une description articulatoire.
Le son caractéristique des voyelles est généré par la vibration des plis vocaux (anciennement appelés « cordes vocales »). Pour vibrer, ceux-ci doivent être assez proches l'un de l'autre pour que la pression de l'air sous le larynx augmente. Les plis vocaux s'écartent l'un de l'autre sous l'effet de la pression subglottale, la partie inférieure de chaque pli entraînant la partie supérieure. Dans certaines conditions, l'oscillation des plis vocaux va se maintenir.
Trois types majeurs de phonation sont attestés dans la production des voyelles. Il s'agit de la voix modale, la voix craquée et la voix soufflée. Le type de phonation est en grande partie déterminé par la proportion du cycle glottal pendant laquelle les plis vocaux sont ouverts. En voix modale, les plis vocaux sont ouverts pendant la moitié du cycle glottal et fermés pendant l'autre moitié. En voix craquée, les plis vocaux sont plus rapprochées et l'air se fraye plus difficilement un chemin. Il en résulte une phase de fermeture des plis vocaux plus longue, et une phase d'ouverture plus courte d'autant. En voix soufflée, les plis vocaux vibrent mais avec peu de contact, et par conséquent la glotte est ouverte pendant une portion relativement longue de chaque cycle glottal[3]. Ces différents degrés d'ouverture se situent sur un continuum de types de phonation, qui va de la voix dévoisée (en anglais, voiceless), où l'ouverture est maximale, à la fermeture glottale (en anglais, glottal closure)[4].
Dans l'Alphabet phonétique international, un a prononcé en voix modale est noté [ɑ], un a prononcé en voix soufflée [ɑ̤], un a prononcé en voix craquée [ɑ̰], un a dévoisé [ɑ̥].
Autres articulateurs
Le timbre des voyelles dépend : 1o du nombre ; 2o de la forme ; 3o du volume des filtres traversés par l'air expiré.
Nombre des filtres.
Lorsqu'une partie de l'air passe par les fosses nasales, les voyelles sont dites nasales :
Lorsque les lèvres sont projetées vers l'avant, il se crée un espace entre celles-ci et les dents; cette cavité labiale constitue un troisième filtre qui modifie le son ; les voyelles produites ainsi sont dites arrondies :
Volume des filtres. Il dépend essentiellement du degré d'ouverture de la bouche. On distingue généralement 4 degrés d'ouverture, bien qu'un continuum entre l'ouverture minimale et l'ouverture maximale soit attesté.
Lorsque deux symboles apparaissent par paire séparée par un point, celui de gauche représente une voyelle non arrondie, celui de droite une voyelle arrondie. Pour ceux situés au centre, la résonance labiale n'est pas spécifée.
Le tableau à droite représente les voyelles les plus courantes (transcrites dans l'alphabet phonétique international) classées selon les trois caractéristiques susdites selon un schéma appelé triangle vocalique.
Approche acoustique
L'acoustique étudie les émissions vocales et pratique l'analyse spectrale des enregistrements, en utilisant, souvent un sonagraphe pour identifier les formants[5].
Approche auditive
Les études psychoacoustiques ont abordé la question de l'identification des voyelles, tentant de cerner, avec des stimulus synthétiques, les relations entre la répartition des partiels et l'identification de la voyelle[6].
Phonologie
La phonologie différencie les sons dans la mesure où cette différence porte un sens dans la langue.
Les voyelles portent l'accent tonique. En français, celui-ci est fixé sur la dernière voyelle sonore ; l'écriture des langues où il est irrégulier peut noter l'accent par un signe diacritique.
Voyelles sonores et sourdes
Certaines langues comme le cheyenne et le japonais[7] emploient des voyelles sourdes, sans vibration des cordes vocales, comme dans le chuchotement.
↑Richard M. Waren, « La perception des séquences acoustiques : intégration globale ou résolution temporelle? », dans McAdams & alii, Penser les sons, Paris, PUF, , p. 62-63.
↑Albert S. Bregman, « L'analyse des scènes auditives : l'audition dans des environnements complexes », dans McAdams & alii, Penser les sons, Paris, PUF, .
↑(en) Ayako Tsuchida, « Japanese Vowel Devoicing: Cases of Consecutive Devoicing Environments », Journal of East Asian Linguistics, vol. 10, no 3, , p. 225–245 (ISSN1572-8560, DOI10.1023/A:1011221225072, lire en ligne, consulté le )
Les parties grisées indiquent une articulation jugée impossible. Les cases blanches vides indiquent des articulations théoriques possibles mais non encore attestées. Les cases marquées d’un astérisque (*) indiquent des sons attestés non encore représentés officiellement dans l’API.
Lorsque deux symboles apparaissent dans une case, celui de gauche représente une consonne sourde, celui de droite une consonne voisée (ne s’applique pas aux clics, présentés au centre des cases en bas du tableau).
Les cases séparées par des pointillés emploient normalement les mêmes symboles API de base, et ne diffèrent éventuellement que par les diacritiques appliqués pour déplacer leur articulation, par exemple la nasale n represente une dentale ou une alvéolaire.
Les affriquéest͡s, d͡z, t͡ʃ, d͡ʒ, t͡ɕ, d͡ʑ sont parfois notées à l’aide des ligaturesʦ, ʣ, ʧ, ʤ, ʨ, ʥ ne faisant plus partie de l’API (il est recommandé de les remplacer par les deux articulations, liées avec une ligature tirant – suscrite ou souscrite).
Les occlusivesinjectivessourdes, sont parfois notées à l’aide des symboles ƥ, ƭ, ƈ, ʠ (formés sur la base de la consonne pulmonique correspondante avec une crosse ajoutée), qui ne font plus partie de l’API (il est recommandé de les remplacer par le symbole de la consonne voisée avec l'anneau diacritique de dévoisement).