Share to: share facebook share twitter share wa share telegram print page

Principe de Huffman

En informatique, le principe de Huffman est une règle informelle souvent invoquée par Larry Wall, le concepteur du langage Perl, pour concevoir les constructions syntaxiques d'un langage informatique et pour écrire des programmes en un langage informatique donné.

Le but du principe de Huffman est d'écrire des programmes concis. Son domaine d'application n'est pas spécifique à Perl, mais peu de concepteurs de langages ont prêté autant d'attention que Larry Wall aux propriétés souhaitables de la syntaxe concrète d'un langage.

Le principe de Huffman fait référence au principe qui sous-tend le codage de Huffman et d'autres algorithmes de compression de données : l'encodage d'un symbole souvent utilisé doit être plus court que celui d'un symbole moins utilisé.

Le principe de Huffman dans la conception d'un langage

Le concepteur d'un langage doit identifier ou créer des structures de contrôle et de données qui seront les plus utilisées et proposer une syntaxe concrète concise et distinctive pour celles-ci. Cela évite au programmeur d'utiliser des abstractions de bas niveau. La concision permet aussi de rendre visibles des similarités entre les instructions ou les expressions consécutives dans un programme et d'en rendre la lecture voire la factorisation plus facile. Autrement, ces régularités auraient été cachées par la verbosité d'abstractions de bas niveau.

Ainsi Perl 6 propose des hyperopérateurs qui opèrent sur tous les éléments d'un tableau, ou un switch qui opère sur des données composites. De même, les langages fonctionnels typés modernes, comme Haskell ou Ocaml, proposent des types algébriques de données et le filtrage par motif qui permettent de créer des structures de données composites et de les modifier.

Finalement, avec du code plus concis, le programmeur peut voir plus de code sur son écran, et moins faire appel à sa mémoire ou éviter de faire défiler du code continuellement sur son écran pour rechercher de l'information. L'inconvénient est un langage plus complexe dont l'apprentissage est plus long.

Le principe de Huffman dans l'écriture d'un programme

Dans un programme, un identificateur doit être d'autant plus court qu'il est souvent utilisé dans sa portée. Conformément au principe de code comme commentaire, on peut d'abord donner un nom explicite au dit identificateur et l'aliaser en son nom court.

Parallèle avec l'évolution des langages naturels

L'étude diachronique des langages naturels montre que leurs constituants les plus utilisés se conforment au principe de Huffman ou y tendent au cours du temps. Ainsi, les pronoms et particules sont généralement très utilisés et sont aussi très courts. Dans des langages non contraints par le corset d'académies normatives, ce mécanisme s'effectue tout naturellement, particulièrement à l'oral. Ainsi, dans un cours de langue, un enseignant anglophone pourra remplacer le mot souvent utilisé de « vocabulary » par son raccourci « vocab ». L'usage de sigles et d'acronymes est aussi une conséquence du principe de Huffman.

Notes et références

Liens externes

  • Le Synopsis 3, partie de la spécification de Perl 6, utilise le verbe « to Huffman-code ». C'est une métonymie qui désigne l'application du principe de Huffman et non l'utilisation du codage de Huffman.
Index: pl ar de en es fr it arz nl ja pt ceb sv uk vi war zh ru af ast az bg zh-min-nan bn be ca cs cy da et el eo eu fa gl ko hi hr id he ka la lv lt hu mk ms min no nn ce uz kk ro simple sk sl sr sh fi ta tt th tg azb tr ur zh-yue hy my ace als am an hyw ban bjn map-bms ba be-tarask bcl bpy bar bs br cv nv eml hif fo fy ga gd gu hak ha hsb io ig ilo ia ie os is jv kn ht ku ckb ky mrj lb lij li lmo mai mg ml zh-classical mr xmf mzn cdo mn nap new ne frr oc mhr or as pa pnb ps pms nds crh qu sa sah sco sq scn si sd szl su sw tl shn te bug vec vo wa wuu yi yo diq bat-smg zu lad kbd ang smn ab roa-rup frp arc gn av ay bh bi bo bxr cbk-zam co za dag ary se pdc dv dsb myv ext fur gv gag inh ki glk gan guw xal haw rw kbp pam csb kw km kv koi kg gom ks gcr lo lbe ltg lez nia ln jbo lg mt mi tw mwl mdf mnw nqo fj nah na nds-nl nrm nov om pi pag pap pfl pcd krc kaa ksh rm rue sm sat sc trv stq nso sn cu so srn kab roa-tara tet tpi to chr tum tk tyv udm ug vep fiu-vro vls wo xh zea ty ak bm ch ny ee ff got iu ik kl mad cr pih ami pwn pnt dz rmy rn sg st tn ss ti din chy ts kcg ve 
Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9 
Kembali kehalaman sebelumnya