Share to: share facebook share twitter share wa share telegram print page

Diacritique

Un diacritique ou signe diacritique (du grec ancien : διακριτικός / diakritikós, « qui distingue ») est un signe accompagnant une lettre ou un graphème pour en modifier le sens ou la prononciation.

En ce qui concerne la lettre ou le graphème, le diacritique peut être placé au-dessus (diacritique suscrit), au-dessous (diacritique souscrit), devant (diacritique prescrit), derrière (diacritique adscrit), dedans ou à travers (diacritique inscrit), ou autour (diacritique circonscrit). Les accents, le tréma et la cédille sont des signes diacritiques.

Présentation

Son objectif est de :

  • modifier la valeur phonétique de la lettre (ou du graphème) ;
  • permettre une meilleure compréhension du texte (les diacritiques ne sont alors pas obligatoires) ;
  • éviter une ambiguïté entre des homographes.

Il existe aussi des lettres diacritiques, muettes et nécessairement écrites à côté de la lettre qu'elles modifient. Accessoirement, elles ont pu devenir un signe diacritique (cf. umlaut et rond en chef).

Au même titre que les ligatures et que les lettres supplémentaires inventées après coup, l'ajout de diacritiques étend le nombre de graphèmes d'une écriture. Dans de nombreux cas, la lettre diacritée n'est pas considérée comme un graphème indépendant mais comme un allographe, c'est-à-dire une autre version écrite de la lettre simple. La lettre diacritée n'intervient alors pas dans le classement alphabétique.

À titre d'exemple, l'accent aigu du français modifie la valeur phonétique d'un e, généralement prononcé [ǝ] (e « muet ») : é vaut alors [e]. L'accent grave sur un a, cependant, ne permet que de distinguer des homographes : la (article) ~ (adverbe de lieu), valant tous deux [la] en français (mais ils se distinguent à l'oral dans certains dialectes du français). On ne considère cependant pas é et à comme des lettres indépendantes de e et a.

En écriture latine, les diacritiques ne servent en général pas à affiner la lecture : ils sont tous obligatoires.

En écriture arabe, où les voyelles ne sont en principe pas écrites, les diacritiques servent au contraire à affiner la lecture. Dans les ouvrages didactiques ou religieux, on peut les noter sous forme de diacritiques. La fatḥa, un trait légèrement oblique suscrit, sert à indiquer la présence d'une voyelle [a] : le mot عدل se lit ʿadl (‘adl) mais se translittère ʿdl. Pour en préciser la lecture, on peut ajouter une fatḥa : عَدل. Dans cet alphabet, on peut aussi compter comme diacritiques les points souscrits ou suscrits qui servent à distinguer un graphème pouvant être réalisé en son de différentes manières. Ainsi le graphème ح sert de support à trois autres lettres, qui sont distinguées dans l'écriture par la présence ou l'absence de point : ج ح خ — prononcées, de droite à gauche : ǧ, ḥ, ḫ.

En règle générale, si une lettre diacritée est présente dans une langue, la lettre simple l'est également. Les exceptions sont :

  • le maltais, qui possède ċ mais pas c ;
  • et dans une certaine mesure, la forme minuscule de l'alphabet latin de base, qui possède i mais pas ı. (Le turc, en revanche, établit la distinction ı/i et I/İ dans les deux casses, I étant dans ce cas la forme capitale de ı et İ celle de i).

Diacritiques selon l'écriture et l'alphabet

Chaque écriture a pu développer ses propres diacritiques :

Prise en compte en informatique

ASCII

Le jeu de caractères ASCII standard, utilise un sous ensemble de 7 bits du système octal (8 bits) très utilisé dans les débuts de l'informatique. Il comporte 128 codes, dont 95 caractères affichables, parmi lesquels 52 caractères alphabétiques, les 26 lettres de l'alphabet latin en casses majuscule et minuscule (ou bas-de-casse), mais pas de lettre accentuée.

Historiquement, vers 1963, la première version de l'ASCII prévoyait des accents (~ ' ` , ^ " ~) pour composer les caractères accentués en combinant le caractère et l'accent, ce par l'utilisation du symbole de suppression ou retour arrière. Mais les lobbies en présence[réf. nécessaire] ont éliminé cette possibilité dès la deuxième version. En conséquence, l'ASCII ne permet donc pas l'échange de textes comportant des caractères accentués.

Pour remédier à cet état de fait, des jeux de caractères appelés ASCII étendu, ont été proposés. Ils comportent 256 codes et requièrent donc 8 bits. Les 128 codes supplémentaires par rapport à l'ASCII de base servent notamment à représenter voyelles et consonnes de l'alphabet latin comportant des signes diacritiques.

Les premiers jeux de caractères étendus, dits pages de code, furent créés par la société IBM pour ses micro-ordinateurs « PC »[réf. nécessaire] ; dans ce système, une page de code ou « CP » (codepage) est spécifiée par un nombre et associée à un ensemble particulier : la CP437 est l'ensemble « américain » ou « graphique » ; la CP850 est l'ensemble « multilingue européen ».

Avec l'apparition des environnements graphiques (Apple Macintosh, Microsoft Windows, X Window, etc.), les caractères « graphiques » des pages de code n'ayant plus lieu d'être[réf. nécessaire] un plus grand nombre de codes étendus ont servi à noter des caractères à signes diacritiques. Les ensembles créés conjointement par IBM et par la société Microsoft pour leurs deux plateformes graphiques, Windows et OS/2 « Présentation Manager », servirent de base pour une série de jeux de caractères ISO, la norme ISO/CEI 8859 qui se décline en quinze ensembles :

  • 8859-1 à 8859-4, 8859-9, 8859-10, 8859-13 à 8859-16 : « Latin1 » à « Latin10 », variantes de l'alphabet latin avec caractères à diacritiques de divers pays et régions (France, Italie, Espagne, Albanie, Turquie, pays scandinaves, Hongrie, Pologne, etc.) ;
  • 8859-6 : alphabets latin et arabe ;
  • 8859-7 : alphabets latin et grec ;
  • 8859-8 : alphabets latin et hébreu ;
  • 8859-11 : alphabet thaïlandais.

Lorsque l'on ne dispose pas d'un clavier d'ordinateur français ou qu'une application ne supporte pas les caractères accentués, on peut rendre ces diacritiques en ajoutant un caractère devant la lettre à accentuer, ou derrière, voire devant et derrière. Cela peut donner par exemple :

Le garc,on ne pouvait 'e`tre l`a cet e'te'.

Voir aussi les exemples dans chaque article sur les diacritiques, ainsi que dans l'article VIQR. L'espéranto fait optionnellement de même, l'article 15-1 de la déclaration des droits de l'homme pouvant ainsi s'écrire Ĉiu rajtas havi ŝtatanecon ou Cxiu rajtas havi sxtatanecon, selon le codage souhaité, sauf si l'ordinateur dispose d'une touche Compose ou similaire.

Unicode

Le Consortium Unicode, qui rassemble la plupart des grands noms de l'informatique, fut créé au milieu des années 1980 pour suppléer le problème de l'incompatibilité des divers codages de caractères développés pour diverses plateformes matérielles et logicielles (EBCDIC et système « codepage » d'IBM/Microsoft, jeux propres à Apple, à HP, jeux Unix, etc.) et en liaison avec le développement de la norme ISO/CEI 10646.

Le but initial était de développer un système de codage non plus sur 8 bits mais sur 16 bits, ce qui permet le codage de 216 soit 65 536 caractères. Actuellement, la norme a été étendue au-delà des 16 bits, car la variété des caractères et symboles (notamment les symboles mathématiques et scientifiques) à représenter excède de beaucoup cette limite, la seule écriture chinoise avec ses diverses variantes dépassant déjà cette limite de 65 536.

Le principe retenu a été de grouper des ensembles ou sous-ensembles de caractères et symboles par « pages » de 256 codes ou « blocs » ; par exemple, les blocs 0 à 3 correspondent à quatre sous-ensembles de l'alphabet latin, le bloc 6 aux « signes diacritiques combinés » associables aux caractères de l'alphabet latin, le bloc 7 aux caractères grecs et coptes, le bloc 11 à l'hébreu, les blocs 12 à 14 aux alphabets arabe et syriaque, le bloc 58 aux symboles monétaires, les blocs 63, 73, 77 et 78 aux symboles mathématiques, etc.

Dans sa version finale, le système Unicode 16 bits n'a pas retenu les écritures pictographiques, qui répondent à une autre norme.

Il y a au moins trois manières (méthodes d'entrée) d'insérer un caractère Unicode dans un document :

  • par valeur ;
  • par numéro d'ordre ;
  • par alias.

L'inscription par valeur consiste à placer dans le document la séquence numérique de 16 bits qui correspond à un caractère donné. Les méthodes par numéro d'ordre sont utilisées dans certains types de documents seulement, notamment dans les fichiers de format RTF et HTML ou assimilés (XML, PHP notamment). Dans tous les cas, le principe est le même : faire précéder ou entourer le numéro ou l'alias d'une « séquence d'échappement ».

Dans les documents HTML, on place la séquence « & » (alias) ou « &# » (numéro) au début et le signe « ; » à la fin de la séquence, et entre les deux le numéro d'ordre ou l'alias.

Par exemple, les séquences «  » et « & » permettent de représenter le signe « et commercial » (appelé aussi « esperluette » ou « ampersand »), « & ».

HTML

À cette notation basée sur le numéro (voir ci-dessus), certains préfèrent la notation par alias, plus simple à mémoriser. La liste étant longue, un seul exemple est donné pour chacun. Si l'exemple est donné avec la lettre a, on peut utiliser l'entité HTML (et donc le signe diacritique correspondant) avec toutes ou la plupart des lettres, selon la règle ci-après. Si l'exemple est donné avec une autre lettre, l'entité HTML ne peut être utilisée qu'avec quelques lettres.

Pour appliquer le signe diacritique sur une autre lettre que celle donnée en exemple, il suffit de changer la lettre qui suit l'esperluette. Ainsi, á donne un a avec accent aigu (á), pour obtenir un i accent aigu (í), il faut écrire í. Ceci s'applique aussi aux majuscules : Á donne Á, Í donne Í.

á ʼn ă č ç â ő ċ à ā
á ʼn ă č ç â ő ċ à ā
ŀ ı ą å ø đ ł ã ä
ŀ ı ą å ø đ ł ã ä
´ ' ˘ ˇ ¸ ˆ ˝ ˙ ` ¯ ˛ ˚ ˜ ¨
´ ' ˘ ˇ ¸ ˆ ˝ ˙ ` ¯ ˛ ˚ ˜ ¨

Notes et références

Voir aussi

Sur les autres projets Wikimedia :

Bibliographie

  • (en) « Diacritics Project @ Typo.cz », sur diacritics.typo.cz
  • (en) Palo Bálik, Fikip Blažek, Robert Kravjanszki, Agnieszka Małecka et Zofia Oslislo, The Insects Project, Problems of Diacritic Design for Central European Languages, (lire en ligne)
  • (en) J.C. Wells, « Orthographic diacritics and multilingual computing », Language Problems and Language Planning, vol. 24, no 3,‎ (lire en ligne)

Articles connexes

Read other articles:

SungWon ChoCho pada Colorado Anime Fest 2022Lahir9 Desember 1990 (umur 33)Minnesota, Amerika SerikatNama lainProZDPekerjaanYouTuberpengisi suaraTahun aktif2015–sekarangSuami/istriAnne Marie Salter ​ ​(m. 2016)​Informasi YouTubeNama samaranProZDKanal ProZD Tahun aktif2006–sekarangGenreKomediparodipermainan videoulasanmakananPelanggan3,7 juta[1](16 Januari 2022)Total tayang1,5 miliar[1](16 Januari 2022) Penghargaan Kre…

76OsOsmiumKristal osmium murni Garis spektrum osmiumSifat umumNama, lambangosmium, OsPengucapan/osmium/[1] Penampilankeperakan kebiruanOsmium dalam tabel periodik 76Os Hidrogen Helium Lithium Berilium Boron Karbon Nitrogen Oksigen Fluor Neon Natrium Magnesium Aluminium Silikon Fosfor Sulfur Clor Argon Potasium Kalsium Skandium Titanium Vanadium Chromium Mangan Besi Cobalt Nikel Tembaga Seng Gallium Germanium Arsen Selen Bromin Kripton Rubidium Strontium Yttrium Zirconium Niobium Mol…

Australian women's cricket team New South WalesPersonnelCaptainAlyssa HealyCoachGavan TwiningTeam informationColours  Light Blue   Dark BlueFoundedFirst recorded match: 1891Home groundNorth Sydney OvalCapacity16,000Secondary home ground(s)Hurstville Oval, Blacktown ISP OvalHistoryFirst-class debutVictoriain 1934at University Oval, SydneyAWCC wins13WNCL wins20WT20C wins2Official websiteNSW Breakers The New South Wales Women cricket team, also known as the New So…

Фазовая диаграмма двухкомпонентного положительного азеотропа (состав отмечен пунктирной линией) Азеотро́пная смесь — смесь двух или более жидкостей с таким составом, который (при данном конкретном давлении) не меняется при кипении, то есть составы равновесных жидкой …

Jam Kota Kantor Pos Tamworth Tamworth adalah sebuah kota dan pusat administrasi wilayah barat laut New South Wales, Australia. Terletak di Sungai Peel di dalam wilayah pemerintah lokal Tamworth Regional Council, kota ini adalah kota terbesar dan terpadat di wilayah North Western, dengan populasi 42.872 pada Juni 2018, menjadikannya kota pedalaman terbesar kedua di New South Wales. Tamworth terletak 318 km (198 mi) dari perbatasan Queensland, dan terletak hampir di tengah antara Brisban…

Parlement de DombesFaçade du bâtiment.PrésentationDestination initiale parlement de l'Ancien RégimeDestination actuelle palais de justiceConstruction 1698Patrimonialité Recensé à l'inventaire général Inscrit MH (2006)LocalisationPays  FranceRégion Auvergne-Rhône-AlpesDépartement AinCommune TrévouxAdresse 1, rue du PalaisCoordonnées 45° 56′ 25″ N, 4° 46′ 33″ E Géolocalisation sur la carte : France Géolocalisation sur la carte&…

عبد الرحمن العجلان معلومات شخصية الميلاد سنة 1938  عيون الجواء  الوفاة 7 مايو 2021 (82–83 سنة)  مكة المكرمة  مواطنة السعودية  الحياة العملية المهنة عالم مسلم،  وقاضٍ  اللغة الأم العربية  اللغات العربية  تعديل مصدري - تعديل   عبد الرحمن العجلان (1938 - 7 مايو 202…

For the federal constituency formerly represented in the Dewan Rakyat, see Rawang (federal constituency). This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Rawang, Selangor – news · newspapers · books · scholar · JSTOR (September 2014) (Learn how and when to remove this template message) Town in Selangor, MalaysiaRawangTownOther&#…

Glaucotes Glaucotes yuccivorus Klasifikasi ilmiah Kerajaan: Animalia Filum: Arthropoda Kelas: Insecta Ordo: Coleoptera Famili: Cerambycidae Genus: Glaucotes Glaucotes adalah genus kumbang tanduk panjang yang tergolong famili Cerambycidae. Genus ini juga merupakan bagian dari ordo Coleoptera, kelas Insecta, filum Arthropoda, dan kingdom Animalia. Larva kumbang dalam genus ini biasanya mengebor ke dalam kayu dan dapat menyebabkan kerusakan pada batang kayu hidup atau kayu yang telah ditebang. Refe…

Piala Italia 2022–2023NegaraItaliaTanggal penyelenggaraan30 Juli 2022 – 24 Mei 2023Jumlah peserta44JuaraInter Milan(gelar ke-9)Tempat keduaACF FiorentinaJumlah pertandingan45Jumlah gol143 (3.18 per pertandingan)Pencetak gol terbanyakWalid Cheddira (5 gol)← 2021–2022 2023–2024 → Piala Italia 2022–2023 adalah musim ke-76 dari kejuaraan piala nasional sepak bola di Italia.[1] Jumlah tim yang berpartisipasi adalah 44 klub.[2] Inter Milan adalah juara bertahan.[3]…

У этого термина существуют и другие значения, см. Нюкта (значения). Иное название этого понятия — «Никс»; см. также другие значения. Нюкта/Никтадр.-греч. Νυκτός Нюкта, богиня ночи (Адольф Вильям Бугро — «Ночь» (1883)) Мифология древнегреческая религия Сфера влияния ночь По…

Japanese steelmaker Nippon Steel CorporationMarunouchi Park Building, headquarters of Nippon SteelNative name日本製鉄株式会社 (since April 2019)Romanized nameNippon Seitetsu kabushiki gaishaFormerlyNippon Steel & Sumitomo Metal Corporation (2013–2019)Company typePublic KKTraded asTYO: 5401NAG: 5401FSE: 5401SSE: 5401TOPIX Large70 componentIndustrySteelPredecessorsOld Nippon SteelSumitomo Metal IndustriesFounded1970; 54 years ago (1970)Founders Yoshihiro Inayama Shi…

Gerbang utama di Biara Battle. Biara Battle adalah kompleks biara yang separuhnya rusak di kota kecil Battle di Sussex Timur, Inggris. Biara itu dibangun di bekas tempat terjadinya Pertempuran Hastings dan didedikasikan untuk Santo Martinus. Pada awalnya biasa ini diberi nama Santo Martinus, namun kemudian lebih dikenal sebagai Biara Battle. Pranala luar 1066 Battle of Hastings, Abbey and Battlefield - official site at English Heritage Historical record for Battle Abbey[pranala nonaktif perm…

Pour les articles homonymes, voir L'Opération Prométhée (homonymie). L'Opération Prométhée est une base de données sur les incendies de forêts de la région méditerranéenne en France. Dès 1971, à la suite des grands incendies de 1970 et, en particulier, de celui du Tanneron (4 octobre 1970) qui coûta la vie à l’épouse et aux enfants de Martin Gray, l’État a décidé de doter la zone méditerranéenne d’un outil permettant la connaissance statistique des feux de forêts et d…

2016年美國總統選舉 ← 2012 2016年11月8日 2020 → 538個選舉人團席位獲勝需270票民意調查投票率55.7%[1][2] ▲ 0.8 %   获提名人 唐納·川普 希拉莉·克林頓 政党 共和黨 民主党 家鄉州 紐約州 紐約州 竞选搭档 迈克·彭斯 蒂姆·凱恩 选举人票 304[3][4][註 1] 227[5] 胜出州/省 30 + 緬-2 20 + DC 民選得票 62,984,828[6] 65,853,514[6] 得…

2016年美國總統選舉 ← 2012 2016年11月8日 2020 → 538個選舉人團席位獲勝需270票民意調查投票率55.7%[1][2] ▲ 0.8 %   获提名人 唐納·川普 希拉莉·克林頓 政党 共和黨 民主党 家鄉州 紐約州 紐約州 竞选搭档 迈克·彭斯 蒂姆·凱恩 选举人票 304[3][4][註 1] 227[5] 胜出州/省 30 + 緬-2 20 + DC 民選得票 62,984,828[6] 65,853,514[6] 得…

莎拉·阿什頓-西里洛2023年8月,阿什頓-西里洛穿著軍服出生 (1977-07-09) 1977年7月9日(46歲) 美國佛羅里達州国籍 美國别名莎拉·阿什頓(Sarah Ashton)莎拉·西里洛(Sarah Cirillo)金髮女郎(Blonde)职业記者、活動家、政治活動家和候選人、軍醫活跃时期2020年—雇主內華達州共和黨候選人(2020年)《Political.tips》(2020年—)《LGBTQ國度》(2022年3月—2022年10月)烏克蘭媒體…

Putri Astrid, Ny. Ferner (Astrid Maud Ingeborg; lahir 12 Februari 1932) adalah putri kedua dari Raja Olav V dan istrinya, Putri Märtha dari Swedia. Dia adalah kakak perempuan dari Raja Harald V dari Norwegia dan adik perempuan dari mendiang Putri Ragnhild.[1] Putri AstridNy. FernerPutri Astrid, 1950KelahiranPutri Astrid dari Norwegia12 Februari 1932 (umur 92)Vila Solbakken, Oslo, NorwegiaWangsaGlücksburgNama lengkapAstrid Maud IngeborgAyahOlav V dari NorwegiaIbuPutri Märtha dari …

Republic of Ireland national football team results Irish Free State – 1924–1935 Ireland (FAI) – 1936–1954 1954–1959 1960–1979 1980–1989 1990–1999 2000–2009 2010–2019 2020–present   Win    Draw    Loss This article contains the results of the Ireland team selected by the Football Association of Ireland. It was previously known as the Irish Free State. After a FIFA ruling they became the Republic of Ireland in 1954. 1930s 1936…

حفل توزيع جوائز الأوسكار الرابع   الجائزة Academy Awards التاريخ 10 نوفمبر 1931 (10 نوفمبر 1931) المكان فندق بيلتمور البلد الولايات المتحدة  المضيف لورانس غرانت الجوائز أفضل فيلم سيمارون الأكثر فوزا سيمارون أكثر ترشيح سيمارون الموقع الرسمي الموقع الرسمي  حفل توزيع جوائز الأوس…

Kembali kehalaman sebelumnya