Les langues construites Délimitation, historique et
typologie suivies d’une illustration du processus de
création d’une langue naturaliste nommée «tüchte»
Autore: Alexis Huchelmann
Data della SM: 04-16-2018
Data FL: 04-01-2019
Numero FL: Florida-00005B-00
Citazione: Huchelmann, Alexis. 2018. “Les langues
construites Délimitation, historique et
typologie suivies d’une illustration du
processus de création d’une langue
naturaliste nommée «tüchte».” Florida-00005B-
00, Fiat Lingua,
01 April 2019.
Diritto d'autore: © 2018 Alexis Huchelmann. This work is
licensed under a Creative Commons Attribution-
Non commerciale, senza derivati 3.0 Licenza non trasportata.
http://creativecommons.org/licenses/by-nc-nd/3.0/
Fiat Lingua è prodotto e gestito dalla Language Creation Society (LCS). Per maggiori informazioni
riguardo alla LCS, visita http://www.conlang.org/
UniversitédeStrasbourgFacultédesLettresAnnéeuniversitaire2017-2018MémoiredeMaster2eannéeLeslanguesconstruitesDélimitation,historiqueettypologiesuiviesd’uneillustrationduprocessusdecréationd’unelanguenaturalistenommée«tüchte»RédigéparAlexisHuchelmannsousladirectiondeMmeHélèneVassiliadouSoutenule16avril2018devantunjurycomposéde:M.leProfesseurThierryRevolM.leProfesseurRudolphSockRemerciements
Ce travail n’aurait pas été possible, ou tout du moins de bien plus piètre qualité, sans
le soutien de plusieurs (groupes de) personnes.
Tout d’abord, je tiens à remercier Mme Vassiliadou, ma directrice de recherche, qui
m’a plusieurs fois sauvé du doute et s’est battue pour que je finisse. Tepə ni kí sproats
zampanel, madam !
Les membres du jury Messieurs les professeurs Revol et Sock, pour avoir accepté de
lire mon travail. Müsyö, nakə ni vakaiyosta ye nat kō !
Ma famille et mes amis, qui n’ont jamais jugé mes recherches et centres d’intérêt
défavorablement, et m’ont même soutenu tout le long. Pavə ni ya grant !
Le CROUS de Strasbourg, une des principales sources de financement de ce travail.
Galt sə vanapsə !
Enfin les membres du forum L’Atelier et l’ensemble de la communauté idéolinguis-
tique, passée, présente et à venir, qui sont la raison principale de l’existence de ce projet.
Märsi a yevə, noya-tsüxtə !
introduzione
Depuis le début du xxie siècle, on constate la présence de plus en plus marquée dans
les médias audiovisuels de langues fictionnelles. La télévision nous montre le dothraki
et le valyrien dans Games of Thrones (USA 2011-présent), le cinéma parle na’vi dans
Avatar (USA 2009, James Cameron), et même un jeu vidéo, Far Cry : Primal (Francia
2016), voit ses personnages s’exprimer en wenja. Fictionnelles parce qu’à l’intérieur du
cadre dans lequel elles s’inscrivent, elles sont considérées langues au même titre que
l’allemand ou le latin, que des personnages s’expriment dans ces idiomes ou que des
inscriptions dans une écriture originale se présentent au spectateur.
On s’attendrait à ce que, hors de ce cadre, l’illusion cesse, et qu’elles ne se pré-
sentent au curieux que comme une improvisation des acteurs, une création purement
phono-esthétique de la part de l’ingénieur du son, ou une langue peu connue à laquelle
on aurait accolé un nouveau nom. Si c’est le cas, respectivement, pour la langue des
dieux du Cinquième élément (France 1997, Luc Besson), le huttais de Star Wars : Uno
Nouvel Espoir (USA 1977, George Lucas) et l’ewok (basé sur le kalmouk 1) de Star
Wars : le Retour du Jedi (USA 1983, Richard Marquand), d’autres ont la prétention de
pouvoir être parlées en dehors de l’écran. C’est le cas par exemple de la langue des
dragons dans le jeu vidéo Skyrim (USA 2011), qui possède un vocabulaire propre d’en-
viron 646 mots 2. Toutefois, la grammaire est calquée sur celle d’un anglais simplifié,
1. Langue mongole parlée en Russie.
2. Selon le site non-officiel Thuum.org (https://www.thuum.org/) [consulté le 29/01/2018].
1
2
c’est-à-dire que les noms auront des désinences pour le pluriel et le génitif seulement,
les verbes n’auront pas de flexions en personne et uniquement un temps synthétique, le
passé, aux côtés de formes analytiques pour le reste. La syntaxe est également anglaise :
on observe, entre autres, l’inversion du sujet dans les questions, l’ordre dans les syn-
tagmes est celui de déterminant-déterminé. Sans parler du lexique dont les définitions
correspondent presque toujours exactement à celles de la langue source. Pour exemple :
(1) Quethsegol
pierre
do
yol
Di
feu
lot
grand
vahrukiv
commémore
dovah
drago
Lodunost
Lodunost
kiir
enfant
jun
roi
Jafnhar
Jafnhar
wo
qui
lost
être.pst
ag
brûler
nahlaas
vivant
naal
par
« Cette pierre commémore l’enfant-roi Jafnhar qui fut brûlé vivant par le feu du
grand dragon Lodunost »
Mise à part l’absence de déterminants, la syntaxe est la même que celle de l’anglais : le
passif est exprimé par le verbe « être », nahlaas correspond exactement à l’adverbe alive,
l’ordre syntaxique est SVO déterminant-déterminé, le pronom relatif a la même forme
que l’interrogatif, eccetera. De plus, l’alphabet draconique utilise des digrammes,
(+
sur l’alphabet latin.
D’un point de vue linguistique, il s’agit d’un code, d’une manière de déguiser une
langue existante que l’on peut traduire par simple substitution des signes (lettres ou
mots). Cependant, d’autres auteurs ne versent pas dans une telle facilité : par exemple,
J.R.R. Tolkien, philologue spécialiste du vieil-anglais, créa le quenya et le sindarin, deux
langues elfiques du roman Le Seigneur des Anneaux (Royaume-Uni 1954), sur les bases
esthétiques du finnois (Tikka 2007) et du gallois respectivement 3, tout en leur réservant
une grammaire et un vocabulaire propre, comme on peut le voir dans l’exemple quenya
3. S’entend que la phonologie, la phonotactique et les processus morphophonologiques sont assez
proches pour déclencher chez les auditeurs les mêmes réactions émotionnelles qu’à l’écoute des langues
sources.
qui suit. Il s’agit d’une formule de salutation présente dans le premier livre de la trilo-
gie, citée ici avec des annotations et des indications grammaticales issues du site web
3
Ardalambion (Faulskanger 2016) :
(2) Elen
elen
étoile
síla
sil-ˊa
briller-prs
lúmenn’
lúmë-nna
heure-all
omentielvo
omentië-lva-o
rencontre-1pl.incl-gen
« Une étoile brille sur l’heure de notre rencontre »
À titre de comparaison, voici cette phrase traduite en finnois, où l’on voit que l’auteur
ne s’est pas simplement contenté de remplacer les mots de sa langue maternelle, ou de
la langue source, par des créations purement esthétiques 4 :
(3) Tähti
tähti
étoile
loistaa
loista-a
briller-3sg
tapaamisemme
tapaaminen-n-mme
rencontre-gen-1pl
hetkellä
hetki-lla
moment-all
La grammaire de la phrase quenya est alors originale dans le sens où elle ne copie pas
strictement celle du finnois ; elle s’en inspire à certains égards, avec l’usage par exemple
de l’allatif (complément de destination) pour un complément de temps et l’absence de
déterminant indéfini. Mais elle distingue une première personne pluriel inclusive d’une
autre exclusive (en -lma 5) et place les désinences de cas après les suffixes possessifs ; par
ailleurs, en quenya, le possesseur vient après le possédé dans les constructions génitives,
toutes choses que l’on ne retrouve pas en finnois.
Un autre fait remarquable chez Tolkien est l’attention portée à l’aspect diachronique
du langage : toutes ses langues elfiques (parmi lesquelles le quenya et le sindarin ne
sont que les plus abouties) entretiennent des relations de parenté, dérivant d’une proto-
langue selon des processus phonétiques réguliers. La racine NDOR « terre, sol » donne
le quenya nórë « pays » et le sindarin dôr « région ». Il apparaît que des changements sé-
mantiques se sont également produits durant l’espace de temps (fictif) séparant ces états
4. Traduction de Juva, Pennanen & Pekkanen (1973), nos annotations.
5. La désinence en -lma était présente dans la première édition du roman (1954) ; elle fut remplacée
par celle en -lva dans la seconde (1966), d’après une nouvelle idée de Tolkien.
4
de langue. On trouvera bien d’autres particularités de ce genre en analysant les créations
de Tolkien, pour lesquelles il existe un vaste corpus d’écrits (composé en grande partie
de réflexions linguistiques, bien qu’il y ait également des textes originaux et des traduc-
tions 6). Signalons que Tolkien n’est pas un cas isolé, seulement l’un des plus connus.
Ces créations, qui viennent de se faire décrire comme on décrirait des langues, In
sont-elles ? Si oui, se distinguent-elles des langues dites naturelles, continuellement et
inconsciemment modifiées par leurs locuteurs depuis des temps immémoriaux ? Peut-on
les appeler langues fictionnelles ? Comment s’y sont-ils pris, ceux qui ont bâti de tels
systèmes ? Leur méthodologie peut-elle présenter un intérêt pour la linguistique ?
Afin de répondre à ces questions, nous diviserons ce mémoire en deux grandes par-
ties. La première partie servira d’introduction générale au phénomène des langues dites
construites ou artificielles. Un premier chapitre délimitera le cadre du phénomène, tout
d’abord en définissant le terme de « langue », puis en justifiant le regroupement des
langues traditionnellement nommées « naturelles » (1.2). Ensuite, nous parlerons des
problèmes liés à la classification des pidgins (1.3), des langues Ausbau (1.4), et des
reconstructions de langues utilisées en linguistique comparative (1.5) participant à la
fois d’une genèse naturelle et d’une nature construite. Chemin faisant, les sections sui-
vantes chercheront une terminologie à la fois indicative et en lien avec les recherches
passées pour désigner les langues construites (1.6) que les prochaines sections délimi-
teront dans leur objet : celles qui en sont (1.7) et celles qui pourraient être considérées
comme telles mais n’en sont pas (1.8). Dans le deuxième chapitre nous parlerons des
langues construites dans le temps, y compris à l’époque contemporaine, et de l’histoire
de leur étude. Cette première partie conclura avec un chapitre sur des classifications
internes au phénomène ; on verra alors qu’elles ne sont pas aisées à organiser à cause
de la multiplicité des modèles suivis par les chercheurs, quoiqu’une synthèse puisse se
profiler.
6. Le sujet est traité dans http://www.elvish.org/FAQ.html [consulté le 07/06/2016]
5
La deuxième partie de ce mémoire consistera en une expérience de création d’une
langue fictionnelle pour décrire pas à pas une telle entreprise. Un tel travail, avec pour
objet une langue potentiellement reconnaissable comme langue naturelle, n’a jamais été
fait, comme sera expliqué dans le chapitre d’ouverture. Le cinquième chapitre présen-
tera le protocole expérimental : tout d’abord la notation chronologique utilisée, puis les
différentes aides informatiques disponibles (5.2), l’organisation du lexique (5.3) et la
gestion des emprunts intra-diégétiques (5.4). Le sixième chapitre sera une description
du déroulement de l’expérience proprement dite, en commençant par la création du ma-
tériel de base (6.1), puis en décrivant les étapes pseudo-diachroniques qui feront passer
ledit matériel au produit final : changements phonologiques (6.3.3), sémantiques (6.4),
morphologiques et syntaxiques (6.5). Enfin, le septième et dernier chapitre consistera en
les observations faites pendant et après l’expérience, au sujet du rythme de travail, de la
perception externe de la langue, et des questions techniques.
La grammaire et le dictionnaire de la langue créée se trouvent respectivement en
annexes A et C. Toutes les langues construites évoquées sont exemplifiées en annexe
F, et les abréviations dans les gloses morphosyntaxiques des exemples sont définies en
page 7.
Abréviations dans les gloses
morphosyntaxiques
1 1e personne
2 2e personne
3 3e personne
abl ablatif
acc accusatif
actv voix active
adj adjectif
adv adverbe
agr accord
ag agentif
all allatif
an animé
aor aoriste
art article
attr épithète
aux auxiliaire
circ circonstanciel
cm marqueur de classe
cs état construit
c genre commun
dat datif
decl déclaratif
def défini
dem démonstratif
dist distributif
excl exclusif
fut futur
f féminin
gen génitif
gno gnomique
imp impératif
incl inclusif
ind indicatif
inf infinitif
6
Abréviations dans les gloses morphosyntaxiques
7
int intensif
loc locatif
m masculin
neg négation
nmlz nominalisation
nm nom
nom nominatif
n non-, In-
n neutre
pass passif
pauc paucal
pej péjoratif
pfx préfixe
pl pluriel
pn nom propre
poss possessif
prep préposition
prf parfait
proh prohibitif
prox proche
prs présent
pst passé
ptcp participe
q question
refl réflexif
rel relatif
rem lointain
rep information rapportée
sg singulier
subj subjonctif
suff suffixe
supl superlatif
temp temporel
top topique
tr transitif
vb verbalisateur
v verbe
P patient
Première partie
Cadre
8
Chapitre 1
Définitions et nomenclature
Nous commencerons par définir le cadre linguistique de l’étude, partant du plus gé-
néral (le langage) pour arriver au plus particulier, celui des langues naturelles et non-
naturelles.
1.1 La notion de langage et la différenciation en langues
Avant de distinguer entre les langues rentrant dans le cadre de cette étude et les autres,
il s’agit de définir le terme même de langue. Selon la définition succincte donnée en in-
troduction à la Grammaire méthodique du français, les langues sont « des moyens de
communication intersubjectifs » (Riegel, Pellat et Rioul 2009, chap. IO). Hagège &
Haudricourt (1978, P. 15), plus précis, écrivent « [qu’]une langue est un système de com-
munication propre à un groupe humain déterminé par sa situation dans l’espace et dans
le temps ». Bien entendu, le médium transmettant les messages linguistiques n’influe
pas sur les contours définitoires que l’on donne au langage. Les langues des signes sont
visuelles et utilisent des gestes produits dans le haut du corps comme unités minimales
(Stokoe 1960). De même, l’écrit, vu comme la parole appliquée à un médium visuel,
rentre dans le cadre de la linguistique : ici aussi, il est possible de former un nombre infini
9
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
10
d’énoncés valides à partir d’un nombre fini de constituants. Et même pour des langues
comme le français qui n’ont pas de correspondance exacte symbole écrit/phonème – ce
qui rend l’analyse morphologique différente – une syntaxe et un vocabulaire communs
assurent l’intercompréhension (Blanche-Benveniste 2010, chap. III).
Pour ces raisons, lexicales et syntaxiques, on considère certaines langues, comme
le français, la LSF ou le chinois, comme bien distinctes entre elles. Mais les limites
peuvent être floues en présence d’un continuum de variations, diatopiques, diastratiques
ou autres : la limite à partir de quand un dialecte devient « hautement divergent » par
rapport à un autre, ou une toute autre langue, n’est pas claire. Par exemple, les langues
scandinaves (norvégien, suédois, danois) sont considérées par leurs locuteurs comme
distinctes (chacune possède sa propre littérature et ses propres normes orthographiques,
stylistiques et lexicales), mais elles restent, dans une certaine mesure, intercompréhen-
sibles (Braunmüller 2002). Dans ce cas, le découpage en langue dépend de la com-
munauté de locuteurs, qui s’affirment en tant que groupe par l’usage d’une variation
particulière opposée à celle d’un groupe concurrent.
Enfin, se pose la question de la variation diachronique, elle aussi un continuum, mais
pour lequel on ne peut parler d’intercompréhension étant donné qu’il n’y a qu’un sens
d’interaction, le présent portant son regard sur le passé. Quelquefois, la compatibilité des
règles grammaticales couplée à un faible taux de changement lexical permet de parler
véritablement de deux variations de la même langue, comme pour le vieux-norrois parlé
et écrit aux alentours du xie siècle et l’islandais parlé de nos jours. Dans d’autres cas,
comme le vieil-anglais et l’anglais moderne séparés par le même laps de temps, la com-
préhension est affaiblie par une massive réfection du vocabulaire (emprunts au français
et au latin à partir de 1066) et d’importants changements dans la prononciation (quoique
le conservatisme de l’orthographe les masque dans une certaine mesure), ce qui nous
les ferait considérer comme deux langues distinctes. Mais il y a aussi des entre-deux,
comme le grec de la période de la koinè (-ive/ive N.E.) et le démotique moderne, qui
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
11
coexistent encore aujourd’hui en tant que deux registres de langue, le premier (kathave-
roussa) utilisé dans la liturgie chrétienne orthodoxe et les textes les plus formels, et le
secondo (dimotiki) utilisé dans la vie courante.
En somme, la définition d’une langue suivie dans ce travail mêlera l’intercompré-
hension objective et la conscience linguistique des locuteurs : il s’agit d’une forme par-
ticulière du langage (en tant que capacité à assembler des signes en énoncés) dans un
groupe de locuteurs qui se comprennent les uns les autres et opposent leur parler à celui
d’un autre groupe, même s’il y a intercompréhension. Cette définition n’est pas à amé-
nager pour accommoder les langues mortes telles que le sumérien ou l’akkadien qui ne
connaissent plus de communautés vivantes de locuteurs. N’ayant pas laissé de descen-
dance directe, ces dernières ont laissé pour prouver d’interactions langagières des cor-
pora de textes sur de longues périodes de temps couvrant des domaines variés comme le
droit, les chroniques historiques, les mythes religieux, eccetera.
Mais notre définition, assez extensive, montre ses limites dans des cas comme ce-
lui du lemnien 7, dont le corpus est maigre (une stèle funéraire et quelques inscriptions
éparses) et l’existence attestée surtout par les mentions d’auteurs grecs. Il est impossible,
en l’état actuel des choses, de former un nombre d’énoncés illimité à partir des indices
de la langue lemnienne, comme on pourrait le faire du sumérien et de l’akkadien. Il
est cependant possible d’analyser les inscriptions découvertes sans qu’elles trahissent le
fait qu’il n’en existe pas d’autres : la présence de différents mots sur un même axe syn-
tagmatique répété d’inscription en inscription permettent quelquefois de leur assigner
une signification à même de permettre une traduction rudimentaire. Ladite traduction
est grandement aidée par la possibilité de trouver pour ces mots des cognats (mots ap-
parentés) dans une autre langue mieux connue, en l’occurrence l’étrusque (De Simone
2010).
Par conséquent, la définition donnée supra s’enrichit d’une nouvelle clause, où est
7. Langue antique de la mer Égée.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
12
considérée comme faisant partie d’une langue toute collection cohérente d’énoncés à
partir desquels on peut postuler l’existence d’un ensemble plus vaste permettant la com-
munication intersubjective. Cette nouvelle définition inclut les langues pauvrement at-
testées comme le lemnien cité plus haut mais aussi le linéaire A, écriture antique de
Crète notant une langue inconnue sans relation avec des langues mieux attestées dans
l’état actuel des connaissances, et dont le déchiffrement est rudimentaire. En revanche,
elle exclut toujours les systèmes de signes comme le code international des signaux
maritimes (l’utilisation alphabétique exclue) ou les langages des animaux comme ce-
lui des abeilles (Benveniste 1974, chap. 5). En effet, les combinaisons de signes sont
restreintes, ce qui contraint ces langages à la communication de messages limités à un
domaine en particulier : respectivement les interactions possibles entre navires et la lo-
calisation d’une source de pollen. Dans d’autres cas, comme les emojis ou émoticônes
présents en nombre croissant dans les communications électroniques, et dont le « voca-
bulaire » comprend des émotions, des actions et des objets, l’absence de règles claires
donnant du sens aux combinaisons – c’est-à-dire de syntaxe – réduit leur pouvoir com-
municatif à peu, s’ils ne sont pas associés à un texte en langue naturelle ; leur rôle serait
en fait analogue aux intonations et gestes extra-linguistiques du langage parlé (McCul-
loch 2015).
1.2 Les langues naturelles
« Naturel », le qualificatif le plus couramment employé lorsqu’il s’agit d’opposer
des langues comme le chinois ou l’igbo à des langues comme l’espéranto ou l’uropi,
est une notion difficile à faire apparaître clairement dans le cas du langage. Il est vrai
que, hors sévère pathologie mentale, tous les humains peuvent apprendre une langue.
D’autres animaux, comme les chimpanzés, en seraient capables dans une certaine me-
sure, limités par leurs capacités de mémorisation et d’abstraction (Snowdon 1990). Cela
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
13
fait apparaître cette capacité comme toute naturelle, évoluée au cours du temps par les
hominidés 8. Mais, aisément manipulable et soumise à la versatilité des locuteurs, IL
langue se modifie facilement à l’usage. Dans cette perspective, la fameuse hypothèse
de Sapir-Whorf (quoiqu’aucun de ces deux auteurs ne l’ait jamais formulée exactement,
c’est sous ce nom que l’on désigne les travaux sur la relativité linguistique depuis Hoi-
jer (1954)) recherche une corrélation entre la culture, le langage et la cognition. Dans la
même veine, Everett (2009, P. 221-223) liste six possibilités relationnelles entre les trois,
qui ne sont pas toutes exclusives, proposées au fil des années par différents chercheurs :
UN) La cognition influence la grammaire : il s’agit de la théorie de la Grammaire Uni-
verselle de Chomsky et de ses disciples, selon laquelle le cerveau humain possède
une compétence innée pour le langage, avec un certain nombre de paramètres dé-
pendant de la langue du locuteur 9.
b) La grammaire influence la cognition : il s’agit de la première version de l’hy-
pothèse de Whorf, qui reliait la perception du temps des Hopis à l’absence de
distinction temporelle dans leur langue (Carroll 1956).
c) La cognition influence la culture : Everett cite les noms de Brent Berlin et Paul
Kay pour leurs travaux sur le découpage des couleurs dans différentes cultures, dé-
coupage qu’ils indiquent contraint par les capacités perceptives de l’être humain.
d) La grammaire influence la culture : selon Greg Urban (1991), le degré d’utili-
sation des structures actives et passives dans une langue donnée influencerait la
perception que les auditeurs d’une histoire ont de son héros (« agent central donc
héroïque » opposé à « agent périphérique donc moins héroïque »).
e) La culture influence la cognition : Everett parle de ses propres observations quant
à l’absence de système de comptage chez les Pirahãs, qui trouve son origine dans
8. Homo sapiens n’est pas le seul a avoir eu une pensée symbolique. Homo neanderthalensis, son
proche cousin, créait des objets d’art, ce qui semble indiquer une capacité langagière.
9. Chomsky et Lasnik 1993.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
14
une contrainte culturelle (la nourriture est immédiatement consommée, donc non
stockée) mais conduit à un effet durable sur la cognition, en ceci que les adultes
de la tribu sont incapables d’apprendre à compter.
f) La culture influence la grammaire : il s’agit de la thèse proposée par Everett dans
son ouvrage, selon laquelle des valeurs culturelles se retrouvent intégrées dans la
grammaire d’une langue. Chez les Pirahãs, il appelle ceci « immediacy of expe-
rience principle » 10, expliqué ainsi : « Declarative Pirahã utterances contain only
assertions related directly to the moment of speech, either experienced by the spea-
ker or witnessed by someone alive during the lifetime of the speaker » 11 (Everett
2009a, P. 132).
On voit que la question de l’innéité ou non du langage n’est pas résolue. Mais il est certain
que, au sens strict du terme, les langues prises individuellement ne sont pas naturelles,
parce qu’il est nécessaire de les apprendre avant de pouvoir les utiliser. Dans un souci de
continuité avec les chercheurs ayant déjà adressé la question dans des études contrastives
(Gobbo 2011 ; Peterson 2015 ; Yaguello 2006), ce terme restera en usage dans ce
mémoire. Toutefois, il ne couvre pas un ensemble homogène, comme nous allons le
voir.
1.3 Les pidgins et les langues mixtes
Ria Cheyne (nov. 2008) pose une distinction entre les langues naturelles et celles que
nous nommons idéolangues à la section 1.6 et définissons en 1.7, selon le critère suivant :
ces dernières n’évolueraient pas d’un état antérieur de la langue, mais seraient plutôt des
constructions délibérées créées à un moment précis pour un but précis. Cela exclut-il les
10. Principe de l’expérience immédiate.
11. « Les phrases déclaratives en pirahã ne contiennent que des assertions liées au moment de la prise
de parole, soit qu’elles ait été vécues par le locuteur, soit qu’une personne ayant personnellement connu
le locuteur en ait porté témoignage ». Notre traduction.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
15
langues apparues spontanément lors d’échanges entre groupes linguistiques hétérogènes,
que l’on peut pour la plupart dater précisément et dont l’évolution participe de plusieurs
langues, non pas d’une seule ? Celles-ci se répartissent en deux groupes selon le degré
de complexité qu’elles présentent.
Le premier, celui des pidgins proprement dits, comprend les systèmes de communi-
cation qui se forment lorsque deux groupes de langue différente se rencontrent sans avoir
de langue commune. Dans ces cas-là, la communication s’opère au moyen de mots tirés
des deux langues, assemblés selon une syntaxe rudimentaire. Le vocabulaire des pidgins
est limité par le strict nécessaire dans les situations de contact, comme le commerce, IL
pêche ou le travail dans les plantations. Cependant, lorsque un pidgin est transmis à des
enfants pour lesquels il devient langue maternelle, il se complexifie et peut au bout d’une
génération devenir un créole, fonctionnant comme n’importe quelle autre langue. IL
complexification peut prendre la forme de grammaticalisations systématiques de struc-
tures expressives présentes dans les pidgins, et/ou d’emprunts à l’acrolecte (la langue de
base ayant le plus de prestige) (Velupillai 2012, chap. 2).
Le second, celui des langues mixtes, comprend beaucoup moins d’exemples. Il s’agit
de formes de langues qui apparaissent lorsque deux groupes maîtrisent la langue l’un de
l’autre, mais ne se trouvent pas dans une situation où l’un d’entre eux est dominant : les
deux langues se mêlent sans se simplifier. Par exemple, le michif ou méchif, parlé au Ca-
nada par des membres de la nation Métis, emprunte sa morphologie et syntaxe nominales
au français et sa morphologie verbale – très complexe – au cree, langue algonquienne.
Son origine procéderait du mélange de populations francophones et algonquiennes ayant
le même mode de vie (trappeurs), au xixe siècle (Bakker et Papen 1997).
On a dans ces deux cas une image plus ou moins nette des circonstances et de
l’époque de création de ces langues. Mais les pidgins et les langues mixtes se distin-
gueraient des idéolangues en ceci qu’ils apparaissent entièrement du fait d’une nécessité
de communication, sans véritable conscience de l’outil employé pour arriver à cette fin,
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
16
tandis que les idéolangues sont consciemment envisagées par leurs créateurs comme le
but à atteindre.
1.4 Les langues Ausbau, les langues-toits et les langues
revitalisées
La précédente définition semble inclure des projets ayant pour origine une langue
qui est ou a été parlée, mais dont le développement a été en partie ou totalement dirigé
par des instances supérieures. Il s’agit d’un phénomène récent, tirant son énergie à la
fois des phénomènes nationalistes du xixe siècle et de ceux consécutifs aux indépen-
dances coloniales au milieu du xxe siècle. Pour le dire simplement, il s’agit de créer
une langue nouvelle d’expression littéraire à partir de formes anciennes ou dialectales
(Fishman 1974). On en distingue trois sortes : les langues Ausbau qui sont des variantes
langagières érigées en de nouvelles normes, les langues-toits qui sont une synthèse de
différents dialectes, et les langues revitalisés, qui sont comme leur nom l’indique des
langues mortes retournées à l’usage.
L’exemple le plus célèbre de ces dernières est celui de l’hébreu moderne, une version
séculaire de l’hébreu biblique, aujourd’hui langue officielle de l’État d’Israël. La langue
n’était plus parlée depuis le iiiesiècle ailleurs que dans le cadre religieux judaïque. Les
Juifs de la diaspora parlaient la ou les langues du pays où ils se trouvaient (russe, alle-
mand, arabe, ecc.), plus une version dialectale de langues européennes ou autres comme
le yiddish, le ladino et le karaïm 12, influencée par la langue liturgique. C’est le yiddish
qui fut d’abord proposé comme langue nationale par les tenants du sionisme à la fin du
xixe siècle. Mais la langue liturgique, comprise par tout Juif ayant reçu une éducation
religieuse, fut estimée plus à même de servir les besoins des nouveaux colons en terre
palestinienne (qui ne parlaient pas tous yiddish) par Ben Yehuda, journaliste et philo-
12. Aux bases respectivement allemandes, castillanes et turques.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
17
logue qui encouragea la création de néologismes dans cette langue et son usage dans
la vie quotidienne (Okrent 2009, P. 117-123). Lors de son passage comme première
langue apprise par les enfants, l’hébreu subit quelques modifications en provenance des
langues européennes, comme la création de déterminants possessifs indépendants, et ne
se distingue plus de l’hébreu biblique que par le seul vocabulaire. D’autres tentatives
de revitalisation, comme celle du cornique, langue celte (Royaume-Uni) éteinte au xviie
siècle, rencontrèrent moins de succès, ce qui peut s’expliquer par l’absence de besoin
réel d’un moyen de communication alternatif en Cornouailles, où les habitants parlent
déjà tous l’anglais (Shield 1984).
Les langues-toits sont exemplifiées par le norvégien dit nynorsk (« néo-norvégien »),
synthèse des dialectes de l’Ouest de la Norvège réalisée à la fin du xixe siècle, lorsque
le pays se libère de la tutelle du Danemark. Le danois ayant beaucoup influencé le dé-
veloppement de la langue norvégienne, on rechercha une version plus « pure » de cette
dernière qu’on trouva dans les dialectes les plus éloignés géographiquement des centres
administratifs. On créa à partir de ces dialectes une nouvelle norme. Mais cette dicho-
tomie concerne surtout l’écrit : à l’oral, la différenciation en une multitude de dialectes
est encore de mise, qu’on retranscrit dans une de ces deux orthographes. De nos jours, le
nynorsk est minoritaire par rapport au bokmål (« langue des livres ») (Vignaux 2001).
La création de l’euskara batua (langue basque unifiée), du romanche des Grisons et du
rfondou walon (wallon unifié) procède d’une motivation autre qui est de présenter aux
locuteurs de dialectes d’une langue minoritaire une version standard, qui serve de base à
sa transmission aux générations les plus jeunes, celles qui n’ont pas forcément eu le dia-
lecte comme première langue. Le rassemblement de locuteurs derrière un même standard
est également à l’origine de l’emploi de l’indonésien en Indonésie, lequel commença
comme une version simplifiée de dialectes proches mis en contact par le commerce,
puis qui fut érigé en standard après l’indépendance du pays (Errington 1986).
Enfin, les langues Ausbau, dans leur définition la plus large, sont des variations dans
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
18
un diasystème qui sont perçues comme distinctes pour des raisons politiques, sociales,
culturelles ou historiques, malgré la possibilité d’une intercompréhension. Nous avons
déjà cité le cas des langues scandinaves en 1.1 qui se distinguent peu l’une de l’autre sur
le plan linguistique ; il faut y rajouter le roumain et le moldave dans leurs pays respectifs,
le serbo-croato-bosniaque, ou l’urdu et l’hindi, qui ne se distinguent pas plus entre elles
que l’anglais américain de l’anglais britannique ; on revoit l’importance du sentiment
des locuteurs dans la définition d’une langue (Trudgill 2004). Après la « découverte »
de la différence, celle-ci peut être accentuée par la néologie lexicale, l’orthographe (hindi
et ourdou n’utilisent pas le même alphabet) ou la régularisation de la grammaire.
1.5 Les reconstructions scientifiques comparatistes
Enfin, il est une dernière catégorie que l’on considère comme représentant un véri-
table état de langue, bien qu’il n’existe pour elle aucune attestation directe : ce sont les
reconstructions en linguistique diachronique. Par exemple, en procédant par comparai-
son des langues attestées, on a pu reconstruire une image du dernier ancêtre commun
des langues germaniques appelé proto-germanique (Lehmann 2014). Ce dernier n’est
attesté par aucun texte, mais les chercheurs l’étudient, dans sa syntaxe et dans sa morpho-
logie, comme une véritable langue, en tout cas pourvue d’assez de réalité pour justifier
les analyses contrastives. Comme le montre l’exemple du proto-indo-européen, la re-
construction bénéficiant du plus grand nombre de chercheurs, la conception que l’on se
fait de ces langues ancestrales est susceptible de changer drastiquement au fil de la dé-
couverte de nouvelles branches-filles : à l’indo-iranien, slave, latin, grec et germanique
des débuts, on a rajouté le celtique, l’arménien, l’albanais, l’anatolien et le tokharien.
Ces changements sont exemplifiés par la comparaison de trois versions (parmi d’autres)
du même texte, le début d’une fable rédigée par August Schleicher en 1868 qui a été
utilisée par les comparatistes afin de constater les progrès de la recherche. L’exemple
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
19
(4) est l’incipit de la fable originale de Schleicher, qui base sa reconstruction en grande
partie sur le sanscrit ; le (5) est de Lehman & Zgusta (1979), qui en plus de changements
dans la notation (w remplaçant v) introduisent de nouvelles voyelles et la notion d’occlu-
sives palatales (notées par un circonflexe) et change certains éléments de vocabulaire ;
le (6) est la version de Malory & Adams (2006) qui présente des changements de syntaxe
(adverbe cadratif gʷr̥ hxēi « sur une colline » en début de texte), de morphologie (absence
de l’augment temporel *e-) et phonologiques avec la reconstruction de consonnes dites
« laryngales » (notées h-indice). La phrase se traduit par « un mouton qui n’avait pas de
laine vit des chevaux ».
(4) Avis, jasmin varnā na ā ast, dadarka akvams
(5) Owis, kʷesyo wl̥ hnā ne ēst, ek̂ wons espek̂ et
(Mallory et D. Q. Adams 2006, P. 45-47)
(6) Gʷr̥ hxēi h2ówis, kʷésyo wl̥ h2néha ne h1ést, h1ék̂ wons spék̂ et
(ibid., P. 69)
Malgré des différences parfois énormes entre chaque reconstruction, les compara-
tistes gardent à chaque fois le sentiment de travailler sur la même langue. De grandes
parts de l’image que l’on se fait de l’indo-européen sont susceptibles de changer d’après
les recherches futures ; mais la base théorique est ici considérée suffisante pour poser la
réalité passée de la langue.
Ce n’est pas le cas pour toutes les reconstructions. Le nostratique, par exemple, re-
construit pour la première fois par Illič-Svityč (1971) regrouperait les familles indo-
européennes, ouraliennes, altaïques, afro-asiatiques, kartvéliennes et dravidiennes en un
seul phylum. Mais la distance temporelle ainsi considérée – plusieurs dizaines de mil-
liers d’années – entache la rigueur des comparaisons, qui manquent souvent de données
stables (toutes les proto-langues des familles considérées n’ont pas été reconstruites), et
même lorsque Greenberg (2003) se restreint à une branche « eurasiatique » incluant les
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
20
trois premières familles (et y rajoutant des familles et isolats d’Extrême-Orient comme
l’eskimo-aléoute, le nivkh 13, le japonais et le coréen), cette théorie fait l’objet de plus de
critiques que de suivi. On peut donc estimer qu’en l’état actuel de la recherche, la langue
décrite par les reconstructions proposées n’a jamais été parlée sous quelque forme que
ce soit, et ne rentre pas dans le cadre des langues naturelles.
1.6 Quel terme opposer à « langues naturelles » ?
Ayant mentionné la variété rassemblée sous l’étiquette « langues naturelles », nous
allons enfin nommer celles qui n’en sont pas.
1.6.1 Le point de vue externe : les chercheurs
Les termes utilisés par les chercheurs dans leur description du phénomène des langues
non-naturelles sont très variés. Langues artificielles, langues construites, langues inven-
tées, langues imaginaires, langues idéales, uglossies (sur le modèle d’utopie), eccetera. : au-
tant de termes que d’auteurs, et les choses ne vont pas en s’arrangeant lorsque certains
voient des nuances de sens entre certaines de ces étiquettes. Cependant, « artificielles »
et « construites » sont les qualificatifs les plus employés dans la littérature moderne.
Les qualificatifs d’idéales et uglossies concernaient surtout les langues philosophiques
(cf. 2.1.2) dont le but avoué était la perfection, et en certains cas le retour à une langue
originelle (rêvée) de l’humanité (Eco 1994) ; mais il est plus difficile de faire corres-
pondre ces appellations aux langues auxiliaires (3.1.1) ou artistiques (3.1.3) qui sont
plus répandues désormais.
Langues imaginaires s’applique très bien aux langues artistiques, qui prennent place
dans un univers imaginaire, mais pas aux langues auxiliaires, qui ont pour ambition de
prendre pied dans le monde réel, ni aux langues philosophiques, qui proposent un sys-
13. Parlé sur l’île de Sakhaline en Russie.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
21
tème de classification des choses censé correspondre à une réalité objective. De plus,
certaines langues artistiques présentent suffisamment de vocabulaire et de grammaire
pour que des personnes intéressées puissent communiquer avec, et les fassent donc exis-
ter, comme avec le klingon
Artificielles, construites, inventées sont des termes plus neutres qui mettent l’accent
sur un seul aspect de la chose, leur origine (cf. 1.7). Conlang, le néologisme forgé par la
communauté anglophone des inventeurs (cf. 1.6.2), est également de plus en plus présent
dans la littérature depuis la relative démocratisation du terme suite au succès des films
et séries télévisées les employant.
1.6.2 Le point de vue interne : les créateurs
Dans les communautés internet 14 rassemblant les praticiens de cet art, des appella-
tions abrégées pour désigner l’objet de leur attention et eux-mêmes, ont été dégagées
soit par un consensus sur un choix initial, soit par l’usage, et se retrouvent parfois dans
le discours public.
Les créateurs de la première liste de diffusion anglophone, la Conlang Mailing List
en 1991 (Peterson 2015, P. 11), ont procédé par composition, récupérant les premières
syllabes des mots constructed et language pour créer le néologisme conlang 15. Avec
l’ajout du suffixe agentif, conlanger servit à désigner le créateur de conlangs, et avec
le suffixe nominalisateur/abstracteur, on désigna par conlanging l’acte de création. Par
la suite, la première partie du composé est devenue un forme combinante productive
dans des néologismes comme conscript (système d’écriture inventé), conworld (monde
inventé, diégèse), conpeople (peuplade inventée), eccetera. La seconde partie est devenue un
14. Avant l’internet, les créateurs de langues communiquaient peu entre eux, en raison de leur faible
nombre et de leur éloignement géographique.
15. La liste est toujours en activité, on peut s’y inscrire à l’adresse https://listserv.brown.
edu/conlang.html.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
22
suffixe, ou plutôt un lexème lié, dans des néologismes désignant des types de langues in-
ventées : auxlang (langue auxiliaire), engelang (engineered language, langue construite
sur une hypothèse linguistique), romlang (langue à base romane), eccetera. (Peterson op. cit. :
12). Les mots conlang et conlanger ont été inclus dans le Oxford English Dictionary en
2014 (Peterson 2014a).
Pour les autres communautés linguistiques (cf. 2.2), différentes solutions ont été pro-
posées : ou bien il y a emprunt direct à l’anglais ; c’est le cas des Polonais qui utilisent
conlang (pl. conlangi) et les termes associés (comme conlanger) 16 ; ou bien l’idée de
composition elle-même est retenue, mais les radicaux en jeu sont différents : c’est le cas
des hispanophones et des francophones qui utilisent ideolengua et idéolangue respecti-
vement. Le premier de ces termes est en usage depuis au moins le 16 mai 2000, date de
la création du groupe Yahoo ! « Ideolengua – Lingüística e Idiomas Artif ». Le second
est un calque de l’espagnol, choisi parmi d’autres propositions comme languim (langue
imaginaire), forgelangue, glossopoïèse, eccetera. par les membres du forum « l’Atelier Philo-
logique » durant un débat en mai 2008 17. Le préfixe ideo-/idéo-, comme l’anglais con- se
prête facilement au jeu de la néologie, et c’est ainsi que l’on a en français les termes idéo-
linguiste (constructeur de langue), idéographie (système d’écriture inventé), idéomonde
(diégèse, monde imaginaire), ainsi que les wikis dédiés Idéopédia et Idéolexique (dic-
tionnaire comparatif en ligne). Cependant, à la différence du terme anglais, les termes
espagnols et français ne se trouvent pour l’instant dans aucun dictionnaire de référence.
Dans l’optique d’une prise de conscience du monde académique sur le phénomène, ce
mémoire utilisera les termes « idéolangue » et « idéolinguiste » comme équivalents de
« langue inventée » et « inventeur de langue » respectivement.
16. Du forum Conlanger. polskie forum językowe. Lingwistyka conlangi conworldy.
17. http://aphil.forumn.org/t37-adaptons-en-francais-conlang-auxlang
[consulté le 09/04/2016]
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
23
1.7 Cadre des langues inventées
Pour Marina Yaguello (2006), rentrent dans le cadre des langues inventées les pro-
ductions qui à la fois :
(UN) sont revendiquées par l’auteur comme langues
(b) sont des systèmes imaginaires par opposition aux langues naturelles et aux langues
historiquement attestées
(c) proviennent d’une emprise consciente ou inconsciente sur le langage de la part
d’un individu
On voit en (UN) que l’intention de l’auteur est à la fois ce qui leur donne naissance et
ce qui les définit comme langues au même titre que le suédois et le norvégien dans
notre définition ici suivie. Les frontières posées en (b) sont problématiques. Par « ima-
ginaire », on comprend « qui n’existe pas dans le monde réel ». Et pourtant, contraire-
ment à un personnage ou à un lieu, la description – fût-elle incomplète – d’une langue
expose une partie de son système qui est dès lors immédiatement réalisable. Que dire
alors des langues auxiliaires pourvues de méthodes d’apprentissage, créées dans le but
de servir de moyens de communication et qui, pour certaines d’entre elles le sont ef-
fectivement (l’espéranto) ? Pour cette raison, d’autres auteurs, comme Peterson (2015),
réservent l’appellation de « fictionnelles » aux langues qui sont associées à des peuples
imaginaires dans des œuvres de fiction, indépendamment du fait qu’elles soient utili-
sables ou non en tant que systèmes linguistiques complets. Le critère (c) pose un autre
problème encore, par sa mention à la fois de phénomènes conscients et inconscients. Une
langue change dans le temps sous l’action inconsciente de plusieurs de ses locuteurs ;
ici, Yaguello semble penser qu’en réduisant leur nombre à un seul, le nouveau système
créé se verra qualifié d’inventé. C’est certainement à des créations comme le martien de
la médium Hélène Smith, exprimé durant des états de transe à la limite de la glossolalie
(Henry 1988) qu’elle fait référence. Mais dans les cas où l’inventeur justifie ses choix
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
24
par une réflexion tenant aux aspects grammaticaux ou lexicologiques de sa langue, il
s’agit d’une action consciente ; on pourrait même la rapprocher de la planification lin-
guistique (1.4) lorsque le matériau de base appartient à une langue naturelle.
Plus succinct, Peterson (2015) définit les langues inventées comme des créations
conscientes visant à produire un système linguistique complet (mais n’atteignant pas
forcément ce but). Cheyne (nov. 2008) permet à cette définition d’être plus large et
d’englober les simples descriptions de systèmes linguistiques, quand bien même au-
cun exemple ne serait donné. Ainsi, le mercantile, qui ne sert que de décor au roman
de Jack Vance The Languages of Pao (USA 1956) et dont rien n’indique que l’auteur
ait construit plus que nécessaire pour donner une phrase d’exemple, serait pour Cheyne
une langue inventée de plein droit, tandis que pour Peterson il s’agirait d’une langue à
la fois fictionnelle (c’est-à-dire réelle dans son contexte romanesque) et feinte (qui n’est
pas destinée à être système de communication mais en donne l’impression). Sidorova
et Šuvalova (2006), quant à elles, rangeraient le mercantile sous l’étiquette de « langue
construite artistique », en raison de sa présence dans une œuvre de fiction ; le fait que la
langue soit incomplète n’est pas important, tant qu’elle existe dans le cadre de sa fiction.
Leur classification distingue les langues inventées des langues naturelles selon quatre
critères :
(UN) la présence d’un ou plusieurs auteurs déterminé(s)
(b) la secondarité de la fonction communicative
(c) leur restriction à un cadre fermé comme l’internet
(d) le fait que les langues naturelles existent parce qu’elles sont partagées par plusieurs
personnes
(ibid., P. 21)
On voit que ces critères (sauf (UN)) ne laissent pas de place aux langues auxiliaires,
dont les langues inventées se distinguent ; pour celles-ci seul est discriminant le premier
critère.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
25
La position de ce mémoire lors des considérations d’ordre historique sera d’appeler
« langue construite » tout exemple d’un système de communication même fragmentaire
qui tire son origine d’une ou plusieurs personnes à un instant donné. Le mercantile de
Vance rentre donc dans ce cadre, étant donné que nous en avons au moins une phrase
d’exemple.
1.8 Ce qui ne rentre pas dans le cadre
1.8.1 Glossolalies
Le cas d’Hélène Smith cité par Henry se situe à la limite de ce qui constitue une
langue construite telle qu’admise plus haut. Si sa première création, le martien, possède
bel et bien un système (quoique calqué sur celui du français) et qu’il est possible de la
traduire, ses créations subséquentes, comme l’ultra-martien et l’uranien, ne sont plus que
des suites de sons que la médium interprète plutôt qu’elle ne traduit. Ce phénomène rap-
pelle ce qui se passe dans les assemblées chrétiennes de dénomination pentecôtiste, où
des membres de l’assistance peuvent entrer en transe et déclamer des suites de sons, que
l’audience interprète par la suite. Ces instances de parole religieuse sont nommées glos-
solalies ; leurs caractéristiques principales sont une phonologie pauvre (surabondance
de consonnes apicales, vocalisme limité aux voyelles cardinales), une prédominance des
syllabes ouvertes et une cadence régulière, présentant des constructions-échos (Sama-
rin 1968). Elles ne se rattachent à aucune langue existante, quoique les participants aux
séances prétendent qu’il s’agit de véritables langues, humaines ou angéliques, suscep-
tibles d’être interprétées. De telles allégations n’ont jamais été confirmées ; cependant,
dans les cas où la parole exprimée possède une ressemblance superficielle mais voulue
avec une langue existante, on parle de xénoglossie. C’est ce phénomène en réalité que
cherchent à reproduire les pentecôtistes : la capacité à parler toutes les langues, comme
le faisaient les Apôtres après avoir été touchés par l’Esprit Saint, dans le récit biblique de
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
26
la Pentecôte. Dans le cas d’Hélène Smith, une des langues présentes durant les états de
transe fut appelée sanscrit et présentait une ressemblance superficielle avec cette langue.
Il est supposé que la médium reproduisait inconsciemment des bribes de textes qu’elle
aurait lues dans quelqu’ouvrage (Yaguello 2006, P. 186).
Le point important qui exclut les glossolalies du cadre des langues inventées est, In
plus de leur qualité d’hapax (occurrences non reproductibles à l’identique), l’absence
de véritable système linguistique sous-jacent. Ce sont moins des traductions que des
interprétations, similaires à la description d’œuvres d’art picturales ou sonores, qui ne
peuvent être découpées en unités sémantiques bien définies. Chaque personne enten-
dant un glossolale ou une symphonie de Chostakovitch peut en retirer une signification
différente. La glossolalie peut donc être vue comme l’usage artistique des productions
de l’appareil phonatoire, un peu comme le chant. Certains poètes ne se sont pas privés
de n’utiliser que le son dans leurs productions : le mouvement futuriste russe du zaoum
(littéralement « par-delà l’esprit »), au début du xxe siècle, nous donne en exemple des
poèmes comme celui d’Aleksej Kručenyh, que nous citons ici accompagné d’une trans-
littération « à la française » :
Дыр бул щыл
убешщур
скум
вы со бу
р л эз
(dyrr boull chtchyll)
(oubéchchtchour)
(skoum)
(vy so bou)
(èrr èll èz)
(Nilsson 1981)
Certains de ces « mots », comme щыл /ɕːɨl/, violent les contraintes phonétiques du
russe (le phonème /ɕː/ ne se trouve jamais devant /ɨ/) 18. Il n’y a aucune contrainte à faire
du sens de la part du poète.
La musique aussi se permet parfois de privilégier le son au sens des mots, au point
d’abolir le langage. Le groupe français de rock progressif Magma, par exemple, uti-
lise dans les paroles de ses chansons la « langue » kobaïenne. Il s’agit d’une création
18. (Unbegaun 1951)
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
27
de son chanteur, Christian Vander, aux intonations germaniques et slaves. Quoiqu’une
part indissociable de la « mythologie » de Magma s’organise autour du kobaïen, ce der-
nier, comme l’explique son auteur, « n’est pas un langage qui a été conçu de manière
intellectuelle » mais « les sons venaient en parallèle à la composition » durant l’écriture
des partitions (Perchoc 2013). Les mots possèdent un sens, mais celui-ci n’apparaît
pas tout de suite à leur créateur, plusieurs mois peuvent s’écouler avant une traduction,
la syntaxe est quasiment inexistante ; le kobaïen n’est pour l’instant pas un moyen de
communication, seulement une nomenclature.
1.8.2 Langues secrètes et codes
À l’inverse, un message aux abords opaques peut être porteur de sens et traduisible
dans une langue existante, sans qu’il s’agisse toutefois d’un nouvel idiome. Il s’agit des
codes, qui présentent des substitutions et des intermissions régulières plus ou moins com-
plexes de lettres, de mots ou de sons, parfois de morphèmes comme l’a montré l’exemple
(1) en introduction. Comme leur déchiffrement ne dépend que de l’application d’une clef
plus ou moins complexe, et que leur application ne demande pas de connaissances d’une
grammaire autre que celle de la langue à coder, les langues ainsi obtenues sont assez
courantes dès qu’il s’agit de transmettre une information rapidement à une personne du
même groupe, sans que personne d’extérieur à l’échange ne puisse déchiffrer le message
intercepté (Peterson 2015, P. 20). Un exemple assez connu d’une telle langue secrète
est le javanais des cours de récréation françaises, où un segment /gdV/ (avec écho de la
voyelle précédente) est inséré dans le noyau de chaque syllabe :
(7)
çagda vagda biengden ?
Il ne sera là pas difficile de récupérer le message d’origine.
CHAPITRE 1. DÉFINITIONS ET NOMENCLATURE
28
1.9 En résumé
Une langue doit, pour pouvoir être considérée comme telle, être un système de com-
munication, c’est-à-dire pouvoir transmettre des informations. Il peut s’agir d’une com-
munication observable, ou potentielle, dans le cas des langues qui ne sont pas ou plus par-
lées. Les langues naturelles qui n’ont pas, en l’état actuel des connaissances, été créées
par une personne – ou un groupe déterminé de personnes –, se distinguent des langues
dites inventées qui cherchent à s’en distinguer non seulement par le vocabulaire mais
aussi par la grammaire. Ces dernières sont appelées conlangs en anglais et idéolangues
en français par leurs aficionados, que l’on trouve surtout regroupés sur l’internet. Le
phénomène répond à différents besoins selon les époques, pas toujours antithétiques.
Chapitre 2
Perspectives historiques
L’histoire des langues construites remonte au moins à mille ans, cependant la re-
cherche à leur sujet n’a que deux siècles au plus. Nous présenterons leurs chronologies
respectives.
2.1 Les langues construites dans l’Histoire
2.1.1 Les langues mystiques et secrètes (xiie–xviie siècles)
La première documentation disponible au sujet d’une langue inventée concerne la
lingua ignota de Hildegarde de Bingen, abbesse allemande du xiie siècle, qui rédigea
entre autres un lexique lingua-latin (Okrent 2009, P. 10-11 ; Peterson 2015, P. 7 ; Ya-
guello 2006, P. 54). La non-ressemblance des mots avec ceux d’aucune langue exis-
tante, la surreprésentation de la lettre
à un cas de glossolalie particulièrement fécond ; mais la cohérence des définitions des
mots, leur classification selon des taxonomies en vigueur dans les écrits scientifiques
de l’abbesse, les phénomènes de composition et de dérivation visibles, et l’invention
parallèle d’un alphabet de 23 lettres (les litteræ ignotæ) ne vont pas dans ce sens. IL
29
CHAPITRE 2. PERSPECTIVES HISTORIQUES
30
description parvenue jusqu’à nous s’apparente plus à un code qu’à un système linguis-
tique complet, car il n’a été retrouvé qu’un vocabulaire de 1012 mots, majoritairement
des noms, dont cinq furent employés dans une antienne 19 en latin. L’objectif que pour-
suivait Hildegarde de Bingen est peu clair, mais Higley (fév. 2008) émet l’idée, d’après le
vocabulaire traduit –concepts ecclésiastiques, plantes médicinales, vêtements féminins–
qu’elle aurait pu avoir pour objectif d’utiliser cette langue avec ses nonnes.
La situation du bâleybelen (ou bâlaybalan) mentionné pour la première fois dans une
mémoire de Sylvestre de Sacy (1813), est différente. Présentée dans un dictionnaire en
langue turque ottomane (le Kitâbi-i Bâleybelen) dont il existe deux exemplaires, c’est
une langue inventée au xvie siècle par un mystique soufi, Muhyî-i Gülşenî (en turc) ou
Moḥyi Muḥammad Golšani (en persan). Contrairement à la lingua ignota, il semblerait
que des gens aient utilisé la langue pour communiquer, l’ouvrage indiquant que le dé-
veloppement du vocabulaire a été un effort collectif pendant plusieurs années ; de plus,
des textes existent rédigés entièrement en bâlaybalan (quoiqu’ils soient très courts), qui
permettent de constater une grammaire propre, mêlant des structures turques, persanes et
arabes (Häberl 2015). Le cadre religieux est bien présent, parce que la création d’une
nouvelle langue était conçue par le ou les soufis ayant rédigé le dictionnaire comme
la prémisse d’une nouvelle révélation divine, tout comme la Bible avait été révélée en
hébreu et le Coran en arabe.
La relation entre l’invention linguistique et la spiritualité, déjà mentionnée dans le
cas de la glossolalie (1.8.1), s’illustre également dans le cas particulier de l’énochien,
ou langue des anges. Particulier parce qu’encore aujourd’hui de nombreuses personnes
contestent son caractère inventé et l’utilisent comme véritable langage de la magie. Elle
est mentionnée pour la première fois par John Dee, célèbre astrologue de l’Angleterre
élisabéthaine, qui la présente comme la langue parlée par Adam avant la chute, portée à
sa connaissance par des visions envoyées par des anges à son devin personnel, Edoardo
19. Chant liturgique catholique.
CHAPITRE 2. PERSPECTIVES HISTORIQUES
31
Kelley (Laycock et al. 2001) à partir de 1582. Il n’y a pas de correspondance entre les
premiers textes « reçus » par les deux occultistes, dont la forme erratique s’apparente
réellement à une glossolalie, et les derniers plus cohérents, mais dont la syntaxe est
très visiblement anglaise (sans compter les correspondances exactes de digrammes de
l’alphabet angélique avec ceux de l’alphabet anglais, comme sh (+
phonème /ʃ/). Pour ces raisons, il est admis dans les milieux sceptiques que l’énochien est
une sorte de déguisement de la langue anglaise voisine d’un code (cf. 1.8.2) ; cependant,
qui de Dee ou de Kelley en fut l’instigateur reste un mystère.
2.1.2 Les langues philosophiques (xviie–xixe siècles)
Alors que les inventeurs des siècles précédents ne se présentaient pas comme tels de-
vant leurs pairs – s’ils diffusaient seulement leurs créations – mais avaient dissimulé leur
implication active derrière des explications d’ordre spirituel, les nouveaux glossopoètes
du xviie siècle exprimaient leurs buts de façon plus claire. En effet, avec le développe-
ment des mathématiques, les savants de la Renaissance se prirent à rêver d’une langue
plus ordonnée et rigoureuse que les vernaculaires, ou même que le latin, qui avait été
jusqu’à cette époque la langue principale du discours scientifique.
Les premières tentatives prirent inspiration de ce que l’on croyait à l’époque être le
principe des écritures chinoise et égyptienne : l’idéogramme, la représentation graphique
d’une idée et non pas d’un mot (qui varie selon la langue). Une telle analyse était erronée,
les caractères concernés représentant bien des mots grâce à une combinaison graphique
d’indices sémantiques et phonétiques (Rosenfelder 2012, chap. 3), mais elle lança la
mode des pasigraphies, systèmes de symboles destinés à remplacer les mots à la manière
de la notation mathématique. C’est qu’en effet cette dernière est universelle, capable
d’être lue d’une multitude de manières différentes tout en faisant passer une idée exacte,
comme on peut le voir en (8) :
(8)
62
3 = 11
CHAPITRE 2. PERSPECTIVES HISTORIQUES
32
UN. La tierce part de six élevé au carré est onze (français archaïsant).
b. Six puissance deux divisé par trois égale onze (français moderne).
c. Six times six divided by three is eleven (anglais).
d. Elf gleich sechs zum Quadrat (geteilt) durch drei (allemand).
La manière la plus crue d’approcher ce résultat fut d’utiliser les chiffres comme des
lettres. C’est ainsi que procède Cave Beck en 1657 avec son Universal Character, où les
nombres sont affublés d’une définition, et sont agrémentés de lettres préfixées signalant
le temps (verbes) ou le genre (noms). Mais il n’y a aucune relation entre les sens dénotés
par ces mots qui découle des relations entre les nombres eux-mêmes, qui pourrait alors
tout aussi bien être des lettres. La mathématique du langage doit se chercher au-delà de
la simple représentation graphique.
La pasigraphie de Francis Lodwick, présentée dans A Common Writing en 1647, uti-
lise des symboles simples agglutinés les uns aux autres pour exprimer des concepts plus
complexes, comme son glyphe pour « homme » qui est le symbole pour « comprendre »
plus des diacritiques signifiant « celui qui » et « nom propre ».
L’étape suivante pour les constructeurs de langues philosophiques fut de déterminer
quels étaient les concepts de base méritant d’avoir leurs propre symbole. John Wilkins,
dans son Essay Towards a Real Character and a Philosophical Language de 1668, divise
le monde, les actions et les objets, en quarante catégories, qui sont ensuite subdivisées
encore. Chaque nœud est associé à une ou deux lettres, ce qui fait qu’à lire un mot on en
connaît tout de suite la définition. Par exemple, le mot pour « loup », Zitαs, nous apprend
qu’il s’agit d’un mot de la XVIIIe catégorie (les bêtes
(carnivores ). IL
grammaire de la langue, cependant, ne bénéficie pas d’un tel soin et mêle l’anglais au
latin, tant dans le nom des parties du discours que dans leur organisation.
Les langues philosophiques, après une période d’intérêt relatif – Isaac Newton lui-
même s’y essayera (Okrent 2016), et Jean-François Sudre présentera en 1827 une
CHAPITRE 2. PERSPECTIVES HISTORIQUES
33
langue basée sur les sept notes musicales, le solrésol – disparaissent de la scène publique.
La raison de ce désintérêt tient à leur nature même, qui rend l’apprentissage (et donc une
véritable utilisation) très difficile, voire impossible. En effet, il est nécessaire d’avoir en
tête à tout moment la place du concept à exprimer dans la hiérarchie de l’univers, sous
peine d’obtenir un message inintelligible. En tant que système de communication, les
langues philosophiques punissent trop sévèrement les erreurs.
Toutefois, l’idée d’une langue rationnelle refait surface au xxe siècle, avec deux ap-
proches séparées. La première est encore une fois l’idée de la pasigraphie, exemplifiée
par les Blissymbols de Charles Bliss et l’aUI de John Weilgart. Le principe est le même
que chez Lodwick : quelques symboles basiques à assembler. Cependant, les auteurs de
ces idéolangues prétendaient que la forme même des symboles et de leurs combinaisons
correspondait à la nature des concepts. Par exemple, le symbole pour « espace » chez
Weilgart, un cercle prononcé /a/, se justifiait ainsi :
because “space is all around us,” because you must open your mouth to
make a wide space (and mother’s womb is “our first space”) 20
(Okrent 2009, P. 179)
La seconde, plutôt que de concentrer les efforts sur la construction du vocabulaire,
allait enfin examiner la syntaxe du langage. On parle de langues logiques, car il s’agit de
baser la syntaxe sur la logique des prédicats utilisée en mathématiques et dans le nouveau
champ de recherche qu’était l’informatique dans les années 50 ; le but étant, entre autres,
d’éliminer l’ambiguïté structurelle présente dans les langues naturelles, comme dans la
phrase anglaise suivante qui peut se découper de deux manières différentes :
(9)
little girls’ school
UN.
[little girls’] school
b.
little [girls’ school]
20. Car « l’espace est tout autour de nous, » car l’on doit ouvrir la bouche pour créer un large espace
(et le ventre de notre mère est « notre premier espace ». Notre traduction.
CHAPITRE 2. PERSPECTIVES HISTORIQUES
34
(Rosenfelder 2012)
L’idée de James Brown avec le loglan était de tester l’hypothèse Sapir-Whorf (cf.
1.2) : est-ce qu’une langue logique conduirait à une pensée plus rationnelle ? L’expé-
rience qu’il propose dans son article dans Scientific American (J. C. Brown 1960) consiste
à enseigner la langue à un groupe de personnes puis d’évaluer ces personnes avec des
tests logiques. À ces fins, il créa le Loglan Institute, qui devint une organisation à adhé-
sion payante en 1979. Malgré les efforts de Brown, l’expérience ne put jamais se faire, et
la communauté scientifique se désintéressa du projet. De plus, sa réticence à retoucher sa
langue d’après les remarques de ses utilisateurs conduisit la majeure partie des membres
de l’institut à le quitter et à fonder leur propre organisation, le Logical Language Group,
autour d’une nouvelle langue, le lojban.
Celui-ci, basé sur les mêmes principes de logique prédicative que le loglan, fut le
déclencheur de la première procédure légale autour d’une langue construite : Marrone
considérant le loglan comme sa propriété, il vit son concurrent comme du plagiat et atta-
qua le LLG en justice. La décision rendue en 1992 lui donna tort (le terme de « loglan »
avait été en usage général trente ans avant qu’il ne décide de le défendre), mais n’en-
tra pas dans les détails de ce qui pouvait réellement être protégé légalement pour une
idéolangue, mis à part les textes.
2.1.3 Les langues auxiliaires (xixe–xxe siècles)
L’Europe du milieu du xixe siècle est celle de la révolution industrielle qui réduit les
temps de déplacement et stimule le commerce international ; mais aussi celle du réveil
des nationalismes, qui crée des tensions à l’intérieur des grands empires européens et
dans les relations internationales. Ces deux forces opposées conduisent les futurs créa-
teurs de langues auxiliaires à imaginer sérieusement pour la première fois des langues
dont le but est le rassemblement de l’humanité. Des tentatives plus localisées avaient
déjà eu lieu pour des langues de même famille, comme les langues slaves avec les essais
CHAPITRE 2. PERSPECTIVES HISTORIQUES
35
d’unification linguistique portées par la ruski jezik du prêtre croate Duličenko au xviiie
siècle et autres créations panslavistes (Steenbergen 2017), stimulées par le fait que ces
langues sont restées plus proches les unes des autres que ne le sont les langues romanes
ou germaniques entre elles ; ou la lingua universalis du prêtre jésuite Phillipe Labbé
(1663), qui se présente sous la forme d’un latin simplifié et rationalisé. Mais l’écho que
rencontrent ces constructions est faible.
La première des langues auxiliaires à remporter l’adhésion de milliers de gens est
le volapük du prêtre J.M. Schleyer en 1879. Le nom se décompose en vol (monde), -a
(génitif), pük (parler), c’est-à-dire « langue du monde ». Ces mots, comme la plupart
des lexèmes, sont tirés de l’anglais (mondo, parlare) mais déformés selon une volonté de
simplification, comme la structure des racines en monosyllabe C(C)VC ou dissyllabes
C(C)VC(C)VC strict. Schleyer avait conscience de la difficulté de certaines peuplades,
comme les Chinois, à prononcer des sons comme /r/, et ne les inclut pas ; il n’eut cepen-
dant pas la même réflexion sur les voyelles et en inclut 8 distinctes dans sa langue. Le
vocabulaire est donc a posteriori, mais les mots-outils et la grammaire sont a priori et
très schématiques.
Le mouvement volapükiste atteint son apogée en 1889, où l’on compte 283 sociétés
ou clubs, plus de 1 600 diplômés en langue, et environ un million de sympathisants ré-
partis en Europe et en Amérique (Couturat et Leau 1903). Mais certains volapükistes,
menés par Auguste Kerckhoffs, se mirent à réclamer des simplifications et des réformes
langagières, ce que Schleyer refusa en qualité de seul auteur. Ces dissensions condui-
sirent à l’éclatement de la communauté, dont certains groupements allèrent par la suite
proposer leurs propres variantes du volapük (idiom neutral, dil, spokil, ecc.) et l’attention
des foules se reporta sur de nouvelles langues.
Le projet qui récupéra le plus de déçus du volapük, et le surpassa encore, fut l’es-
péranto, présenté en 1887 par L.L. Zamenhof, un médecin de Białystok (Pologne, à
l’époque russe). Avec un vocabulaire international, empruntant surtout aux langues ro-
CHAPITRE 2. PERSPECTIVES HISTORIQUES
36
manes et germaniques, plus reconnaissable que celui du volapük (dont le nom se tra-
duirait en mondlingvo) et une grammaire schématique mais moins complexe (deux cas,
pour quatre en volapük ; verbes conjugués uniquement en temps en face d’un complexe
temps-mode-voix-personne en volapük), l’espéranto séduit et se répand rapidement dans
le monde entier : 688 personnes en provenance d’une vingtaine de pays assistent au pre-
mier congrès international à Boulogne-sur-Mer en 1905. Et contrairement à ce qui se
passa pour le volapük, lorsque les premières critiques linguistiques s’élevèrent, Zamen-
hof, qui avait abandonné tous ses droits à la communauté des locuteurs, ne s’y opposa
pas et proposa même une réforme incluant les critiques. Cependant, la communauté dé-
clina la proposition, et certains réformateurs mécontents décidèrent de créer leur propre
projet en 1907, l’ido (qui signifie en espéranto « descendant »).
Le début du siècle connut un foisonnement sans précédent de nouvelles langues,
qu’on observait partout avec grand intérêt. La Délégation pour l’adoption d’une langue
auxiliaire internationale est fondée en 1901 à l’initiative du mathématicien français Léo-
pold Leau, et est étroitement liée à l’Association internationale des académies. Sa mis-
sion était de passer en revue les projets existants, d’en choisir un, et de se constituer
en organe de propagande pour répandre l’usage de la langue élue (Couturat et Leau
1903). L’ido fut l’objet du choix final en 1907, toutefois la suite du programme ne put
pas s’appliquer en raison de la situation internationale.
La première guerre mondiale porta un coup d’arrêt aux discussions concernant les
langues auxiliaires. Il y en eut encore après-guerre pour proposer des projets à leur avis
« meilleurs », comme le linguiste Otto Jespersen avec le novial en 1928, mais les orga-
nisations internationales s’étaient désintéressées de la question et la fin de la Seconde
Guerre Mondiale, quand l’anglais émergea comme la langue de vainqueurs plus im-
pliqués que jamais dans les échanges internationaux et premiers fournisseurs de média
dans le monde. La seule langue auxiliaire qui, créée par la suite, connut quelqu’emploi,
fut l’interlingua (à base romane) en 1951, parce que ses ambitions étaient moindres.
CHAPITRE 2. PERSPECTIVES HISTORIQUES
37
Conçue par la International Auxiliary Language Association, elle était destinée à servir
de langue d’échange scientifique. Quelques articles y furent écrits jusque dans les années
60 (Okrent 2009, P. 210).
Cependant, les créateurs de langue ne s’arrêtèrent jamais de créer. De nos jours, il
existe encore plusieurs communautés de tailles diverses autour de telles projets et il tente
de s’en former de nouvelles chaque mois. Mais à part l’espéranto, ces projets n’ont pas
autant d’adhérents que peuvent en avoir des idéolangues dont ce n’était pourtant pas
l’objectif, les langues de fiction.
2.1.4 Les langues des médias de masse (xxe–xxie siècles)
Les idéolangues présentes jusqu’ici dans la fiction était les fruits de leur époque :
quand la mode était aux langues philosophiques, les habitants de utopies réglées par la
Raison utilisaient un langage rationnel, avec correspondance parfaite du signifiant à la
nature du signifié, comme l’utopien de l’Utopie de Thomas More (1516) ou la langue
australe du La Terre Australe connue de Gabriel de Foigny (1676) (Menzies 2012) ;
quand la mode était aux langues auxiliaires, les peuplades des contrées utopiques par-
laient une langue facile à la grammaire très régulière, adoptée par toute leur planète,
comme dans Accross the Zodiac de Percy Greg en 1880 ou la série des John Carter de
Mars d’Edgar Rice Burroughs ; lorsque l’hypothèse Sapir-Whorf (cf. 1.2) était en vogue,
les romanciers décrivaient des langues dont la structure déterminait la pensée de leurs
locuteurs, surtout à des fins sinistres comme avec la novlangue de George Orwell dans
1984 dont le vocabulaire volontairement appauvri et la morphosyntaxe simplifiée à l’ex-
trême devaient empêcher l’expression d’opinions contraires à l’idéologie de la société.
L’imagination des auteurs va se porter vers d’autres directions, qui n’auront plus
grand chose à voir avec les grandes tendance philosophiques, scientifiques ou sociales
de leur époque. J.R.R Tolkien, qui travaille dès 1915 à la création de sa famille de langues
elfiques et à la mythologie qui les entoure, présente au monde en 1954 – avec la paru-
CHAPITRE 2. PERSPECTIVES HISTORIQUES
38
tion du Seigneurs des Anneaux – des langues qui existent pour elles-mêmes et servent
de décor à l’histoire, sans prétentions autres que d’insuffler une certaine esthétique. Le
professeur M.A.R Barker, lui emboîte le pas en publiant le jeu de rôle Empire of the
Petal Throne en 1975 qui emploie la langue tsolyáni inspirée du pachtoune, de l’ourdou,
du maya et du nahuatl (Peterson 2015). Comme chez Tolkien, elle s’inscrit dans une fa-
mille plus vaste développée comme si elle avait été naturelle. On trouve aussi une langue
développée dans le roman de science-fiction La Vallée de l’éternel retour par Ursula Le
Guin, le kesh (1985). Une seule phrase, prouvant le caractère construit de cette langue,
est présentée dans le livre ; mais son vocabulaire original, dont une appendice fournit la
clé, imprègne le texte et nomme les concepts étranges présentés dans l’histoire.
Tolkien et Barker étaient linguistes, et c’était aussi le cas de Victoria Fromkin, créa-
trice du pakuni, la langue des hommes-singes, en 1974. Mais là où eux ont travaillé sur
des univers de leur invention, elle est la première personne a avoir été embauchée pour
travailler sur une franchise après coup, en l’occurence la série télévisée jeune public
Land of the Lost (USA 1974-1976) (Alexander 2014). Avant Game of Thrones (cf. In-
troduction), une telle demande de la part d’un studio de production était rare. On ne peut
cependant pas ne pas mentionner le klingon, utilisé pour la première fois dans Star Trek
III (USA 1984, Leonard Nimoy) où il était parlé par les antagonistes du film. Créé par le
linguiste Mark Okrand à partir des improvisations gutturales des acteurs dans le premier
film de la série, son apparence et sa grammaire (OVS, accords verbaux pluripersonnels,
ecc.) devaient être le plus « exotique » possible aux oreilles du public parlant des langues
occidentales. Il s’agit de la première langue inventée artistique dont la grammaire et le
vocabulaire ont été publiés en parallèle d’un film : The Klingon Dictionary (1985) donne
à qui le veut la possibilité de composer ses propres textes dans la langue des guerriers de
l’espace. Avec 300 000 exemplaires vendus, plusieurs conférences annuelles à travers le
monde (la plus fréquentée étant la qepHom’a’ à Saarbrücken en Allemagne), et un ins-
CHAPITRE 2. PERSPECTIVES HISTORIQUES
39
titut (le Klingon Language Institute 21) proposant des certifications officielles de langue
et publiant des traductions allant de Hamlet au Dao De Jing, le klingon est la langue
artistique la plus connue.
Quelques autres idéolangues connurent un succès proche : le na’vi du peuple extra-
terrestre du même nom dans le film Avatar (USA 2009) bénéficie, non pas d’un institut
dédié, mais d’une communauté de fans active et de l’implication de son créateur, le
linguiste Paul Frommer, qui écrit régulièrement au sujet du na’vi et compose des billets
entiers dans cette langue sur son blog personnel 22.
Les langues de Tolkien (des Elfes, Orques et Nains) furent retravaillées pour les be-
soins de la franchise filmique Le Seigneur des Anneaux de Peter Jackson par le linguiste
et expert ès Tolkien David Salo ; l’écrivain n’ayant jamais produit de grammaire ou de
dictionnaire définitif de ses langues, il fallut inventer de nouveaux mots et régulariser
la grammaire pour traduire les dialogues. Pour faire la distinction entre les langues ori-
ginelles de Tolkien et les dérivés par Salo, on appose le préfixe « néo- » à ces derniers,
comme dans « néo-khuzdul ».
La série télévisée Game of Thrones (USA 2011–2017) utilise les langues dothraki
et valyrienne pour les dialogues de certaines scènes. Un manuel d’apprentissage, Living
Language Dothraki (Peterson 2014b), est disponible pour la première de ces langues,
et un cours en ligne sur la plate-forme Duolingo 23 pour cette dernière.
Le fait que ces idéolangues aient attiré à elles des intéressés à travers de franchises
populaires ne doit pas faire perdre de vue que la plupart des idéolangues se sont dévelop-
pées sans le soutien ou la commande d’un studio ou producteur ; mais avant l’invention
d’internet, un idéolinguiste pouvait très bien passer toute sa vie à penser être le seul à
pratiquer ce loisir. Cela changea très vite.
21. https://www.kli.org/ [consulté le 20/07/2017]
22. http://naviteri.org/ [consulté le 20/07/2017]
23. https://en.duolingo.com/course/hv/en/Learn-High-Valyrian-Online
[consulté le 20/07/2017]
CHAPITRE 2. PERSPECTIVES HISTORIQUES
40
2.2 Les communautés d’idéolinguistes de nos jours
Avant la fin du xxe siècle, les seules langues construites portées à la connaissance du
grand public étaient les langues à vocation auxiliaire, et le plus souvent que le seul es-
péranto. Leurs partisans pouvaient compter sur une véritable volonté des communautés
d’alors de se développer, par la tenue de conférences, la publication de livres et la pro-
duction de films (citons pour mémoire Angoroj 24 et Incubus 25). Les langues artistiques,
présentes dans des films, des romans ou des jeux de rôle, avaient une diffusion confi-
dentielle : celles de Tolkien seules eurent la chance d’avoir été intégrées dans un univers
assez célèbre pour déclencher des réflexions d’aficionados à leur sujet ; dès 1971 avec la
publication de Parma Eldalamberon, des lecteurs du Seigneur des Anneaux eurent un es-
pace pour discuter des langues des Elfes telles que présentées dans les livres 26. Mais, Di
même qu’après la parution du Klingon Dictionary, les participants à ces communautés
ne parlaient pas de leurs propres langues construites.
À notre connaissance, l’histoire de l’idéolinguistique comme hobby discuté en groupe
commence le 29 juillet 1991 avec la création de la liste de diffusion Conlang Listserv. Ses
membres s’étaient rencontrés sur Usenet, un réseau informatique antérieur à internet, et
décidèrent d’échanger des courriels sur le thème de leur passion commune. La présence
conjointe d’idéolinguistes intéressés par le côté artistique de la création (artlangers) et
de ceux intéressés par l’adoption d’une langue auxiliaire internationale (auxlangers),
aux buts diamétralement opposés, conduisit à la création en 1996 d’une nouvelle liste
de diffusion réunissant ces derniers, la Auxlang Listserv (Peterson 2015, P. 11-12) ; car
la publicité pour une langue auxiliaire internationale est une action éminemment poli-
tique, sujette à des discussions parfois enflammées dans lesquelles on retrouve de moins
24. (France 1964, Jacques-Louis Mahé) Le premier long-métrage en espéranto.
25. (USA 1965, Leslie Stevens) Le plus connu des longs-métrages espéranto, avec William Shatner
dans le rôle principal).
26. Ainsi que l’on peut l’apprendre sur le site internet de la Mythopoieic Society, qui vend les premiers
numéros à l’adresse http://www.mythsoc.org/store/#parma [consulté le 25/05/2016].
CHAPITRE 2. PERSPECTIVES HISTORIQUES
41
en moins d’arguments simplement linguistiques. En témoignent les nombreuses pages
internet consacrées soit à déprécier l’espéranto (la langue construite ayant eu le plus de
succès) comme celle de Justin Rye 27, soit à présenter une nouvelle langue auxiliaire à
grand renfort d’agressivité et d’exagérations, comme sur le site officiel du slovio (projet
de langue commune slave) de Mark Hučko. Il s’agit d’une langue « aussi simple que
l’espéranto mais comprise par 400 millions de personnes à travers le monde » qui « gagne
du terrain chaque jour », malgré la présence de « clones plagiant clairement le slovio et
violant le copyright de son créateur » 28, dont ce dernier se défend en achetant tous les
noms de domaines Internet contenant le nom de ses concurrents : slovianto, interslavic,
eccetera. (une analyse plus détaillée de ce projet et de l’idéologie qui le sous-tend a été faite
dans Steenbergen 2016).
Loin de ces querelles idéologiques, certains conlangers du début des années 2000 se
regroupèrent autour d’un forum, le Zompist Bulletin Board 29, hébergé par l’un des leurs,
Mark Rosenfelder, créateur de la diégèse Almea et de langues comme le verdurien. Il
fut l’un des premiers à mettre en ligne un guide de construction de langue, le Language
Construction Kit, exposant sa façon de créer, qui devint plus tard un livre (Rosenfelder
2010).
Un autre forum anglophone très fréquenté est le Conlang Bulletin Board 30, qui pro-
pose aussi des espaces de discussion en allemand et en « scandinave » 31.
Certains membres de la Conlang Mailing List (cf. 1.6.2), organisé dans une associa-
tion étudiante à l’université de Berkeley en Californie, organisèrent en 2006 la première
Language Creation Conference aux États-Unis pour réunir les conlangers du pays et
consacrer deux journées à l’étude de leur hobby commun ; par la suite, en 2007, cette
27. http://jbr.me.uk/ranto/ [consulté le 27/05/2016]
28. Ainsi qu’il est annoncé sur la page d’accueil dudit site http://www.slovio.com/ [consulté le
27/05/2016].
29. incatena.org
30. http://www.aveneca.com/cbb/
31. cf. 1.1.
CHAPITRE 2. PERSPECTIVES HISTORIQUES
42
conférence se renouvela cette fois sous l’égide de la nouvellement créée Language Crea-
tion Society, une association non-lucrative ayant pour but de « promouvoir et avancer
l’art, la technique et la science de la création de langues à travers des conférences, des
livres, des journaux, des activités de vulgarisation, ou autres » 32. La LCS publie le jour-
nal en ligne Fiat Lingua 33 et organise des conférences environ tous les deux ans, ainsi
qu’un service d’appel d’offres pour les producteurs, développeurs ou écrivains désireux
d’embaucher un créateur de langue sur un projet, le LCS Job Board 34.
Ces communautés semblent regrouper surtout des Étasuniens, des Brittaniques, des
Scandinaves et des germanophones (y compris des habitants des Pays-Bas). Au moins
deux autres grands regroupements existent autour d’autres langues de travail : le forum
polonais Polskie Forum Językowe 35 (depuis 2012, plus de 600 membres) et le forum
francophone L’Atelier 36 (depuis 2008, près de 300 membres), chacun gérant un ou plu-
sieurs wikis (encyclopédies en ligne collaboratives). Le groupe Yahoo ! hispanophone 37
n’a plus connu d’activité depuis un dernier message le 29 mars 2015, et l’espace de
discussion des idéolinguistes russes n’est qu’une section d’un forum espérantiste 38.
À côté des forums dédiés, il existe aussi des communautés sur des réseaux sociaux
en ligne comme Facebook, Tumblr ou Twitter, surtout avec le mot-clé #conlang.
2.3 Histoire de la recherche
Avant le xxe siècle, les hommes de science n’écrivaient pas au sujet des langues
construites s’ils n’étaient eux-mêmes en train de tenter la création d’une langue uni-
32. http://conlang.org/about-the-lcs/ [consulté le 15/07/2017]
33. https://fiatlingua.org
34. https://jobs.conlang.org
35. https://jezykotw.webd.pl
36. https://aphil.forumn.org
37. https://espanol.groups.yahoo.com/neo/groups/ideolengua
38. http://www.e-novosti.info/forumo/ne-esperanto/
CHAPITRE 2. PERSPECTIVES HISTORIQUES
43
verselle. Couturat et Leau (1903) proposent pour la première fois une Histoire de la
langue universelle présentant les divers projets de langues destinées à la communication
internationales, depuis les langues philosophiques (2.1.2) jusqu’aux langues auxiliaires
proprement dites (2.1.3). Ils les séparent en a priori (formées de racines inexistantes
dans les langues naturelles, par exemple le projet de Wilkins), a posteriori (dérivées de
langues naturelles, par exemple l’espéranto), et mixtes (empruntant aux deux méthodes
de construction, par exemple le volapük). Ils prennent également garde à les distinguer
des pasigraphies, les systèmes de symboles destinés à être compris par toute personne
indépendamment de sa langue maternelle. Chaque langue se voit dédier quelques pages,
comprenant les intentions de son auteur, une brève description, et une critique linguis-
tique, plus ou moins favorable. Couturat et Leau étaient membres de la Délégation pour
l’adoption d’une langue auxiliaire internationale (2.1.3), mais leur ouvrage date d’avant
le choix définitif de cet organisme et le ton adopté, s’il est très critique par endroits, est
assez neutre.
Une autre approche apparaît dans les années 1920 avec la question d’un usage autre
que purement communicationnel ; Helen Eaton (nov. 1927 ; 1934) questionne la valeur
propédeutique d’une langue construite telle que l’espéranto dans l’apprentissage des
langues étrangères et de la grammaire. Cependant, il est permis de regarder ses conclu-
sions encourageantes avec suspicion étant donnée son implication dans la International
Auxiliary Language Association, l’organisation à l’origine de la création de l’interlingua,
LAI à base latine (Esterhill 2000). Les autres recherches au sujet de la propédeutique
des langues construites se basent surtout sur l’espéranto ; citons entre autres Corsetti et
Torre (jan. 1995) sur la réalisation d’une expérience susceptible de comparer les valeurs
propédeutiques de différentes langues.
Bausani ouvre une parenthèse dans un siècle qui n’a d’yeux que pour les langues à
vocation internationale : son ouvrage Geheim- und Universalsprachen (jan. 1970) s’in-
téresse, en plus de celles-ci, aux langues personnelles. La chronologie qu’il propose tient
CHAPITRE 2. PERSPECTIVES HISTORIQUES
44
ainsi compte de la lingua ignota et du bâleybelen. Mieux encore, il présente et analyse
une langue construite de son cru, le markuska, dans le chapitre dédié aux langues enfan-
tines.
L’ouvrage d’Andrew Large, The Artificial Language Movement (1986), est en quelque
sorte une mise à jour de celui de Couturat et Leau, explorant le même cadre historique des
langues auxiliaires. L’attitude de l’auteur vis-à-vis des chances de succès d’une langue
artificielle est toutefois plus tempérée, voire incrédule. Les huit décennies écoulées entre
les deux ouvrages depuis 1903 ont également permis à Large d’étudier les communautés
espérantistes s’étant développées entre temps, et par là la langue en action.
Eco (1994) et Yaguello (2006) concentrent leurs démonstrations sur les langues phi-
losophiques et les diverses tentatives à travers les siècles de retrouver la langue originelle
de l’humanité – on y parle étymologies pseudoscientifiques, pasigraphies, et monogé-
nétisme. La pratique des langues auxiliaires dans leur contemporanéité ne les intéresse
pas ; Yaguello parle quelque peu des langues artistiques comme celles d’Hélène Smith,
les mettant en parallèle à la glossolalie, et cite, sans les explorer, les langues fictionnelles
comme le klingon et le quenya. Le láadan d’Elgin et la lingua ignota ne servent qu’à illus-
trer son chapitre sur la rareté des femmes dans la création de langues. Eco quant à lui
déclare dans son introduction (1994, P. 15) que son ouvrage ne traitera qu’indirectement,
voire pas du tout « les langues romanesques et poétiques » car selon lui
[…] ces cas, pour la plupart, ne présentent que des fragments de langage et
présupposent une langue dont, cependant, ni le lexique ni la syntaxe ne sont
donnés en entier.
Le nouveau terrain d’étude qu’est Internet est pour la première fois pris en compte
par Fettes (jan. 1997) qui mentionne le côté ludique que peut présenter la construction
de langues. Son court article présente une liste des sites sur lesquels se retrouvent les
conlangers anglophones, en plus de fournir un état des lieux de la communauté espéran-
tiste sur le réseau.
CHAPITRE 2. PERSPECTIVES HISTORIQUES
45
Et c’est en Russie qu’est effectuée une revue complète et exclusive des langues
construites artistiques, avec la parution de la monographie de Sidorova et Šuvalova
Internet-lingvistika. Vymyšlennye jazyki (Linguistique sur Internet. Les langues fiction-
nelles) (2006). Leur focus est sur les langues présentes sur Internet hors LAI et langues
romanesques/cinématographiques, c’est-à-dire la création linguistique en tant qu’art se
suffisant à lui-même. À notre connaissance, ce sont aussi les seules linguistes qui ont
exploré, en plus des ressources anglophones sur les langues construites comme lang-
maker.com 39, le côté russophone d’Internet dédié au sujet 40. Après la parution de cet
ouvrage, les deux auteures ont continué leurs recherches en explorant divers aspects des
langues construites, comme la transmission d’idéologies politiques (ici le féminisme)
à travers elles (Sidorova et Šuvalova 2011) ou la place des universaux linguistiques
dans les langues inventées (Šuvalova 2010).
Le plus connu des livres traitant des langues inventées reste cependant sans doute
celui d’Arika Okrent In the Land of Invented Languages (2009), le premier à s’adresser
au grand public. Okrent retrace l’histoire de ces langues depuis Hildegarde de Bingen
mais, contrairement à Yaguello et Eco, elle ne s’arrête pas pour pondérer sur la quête de la
langue originelle, ni ne parle de la glossolalie. Chaque partie du livre présente un aspect
des motivations de la construction langagière : la classification des choses de l’univers,
la communication internationale, les pasigraphies, l’intégration de la logique formelle
au langage, et l’art pur et simple. Pour chaque partie, un idéolinguiste est sélectionné
et son travail sert de fil conducteur ; dans l’ordre Wilkins, Zamenhof, Bliss, Brown et
Okrand.
Enfin, depuis quelques années, le nombre et la nature des ouvrages consacrés aux
langues construites augmentent, certainement grâce à une visibilité accrue depuis leur
utilisation dans des productions audiovisuelles à grand spectacle comme Avatar, Le Sei-
39. Site aujourd’hui disparu.
40. Elles mentionnent par exemple le larimin, une langue assez complète de la diégèse d’Olga Laedel
qu’aucun historiographe n’avait et n’aura relevée.
CHAPITRE 2. PERSPECTIVES HISTORIQUES
46
gneur des Anneaux et Game of Thrones. Citons entre autres les essais collectés dans
From Elvish to Klingon : Exploring Invented Languages (M. Adams 2011), les manuels
de création de langue de Mark Rosenfelder (The Language Construction Kit 2010 ; Ad-
vanced Language Construction 2012) (cf. 2.2) et David Peterson (The Art of Language
Invention 2015) (créateur de langues pour la télévision et le cinéma). Enfin, de plus
en plus d’universités et d’écoles étasuniennes proposent des cours utilisant les conlangs
comme matériau d’introduction à la linguistique générale, comme le font Sanders (2016)
et Anderson (juin 2017).
On n’a pas pris en compte dans l’histoire de la recherche les articles et ouvrages
consacrés à une seule langue construite, comme l’ouvrage de Henry (1988) Le langage
martien consacré aux productions d’Hélène Smith, ou les études qui ont été faites sur
l’espéranto d’un point de vue sociologique, dont un résumé se trouve dans Fiedler (jan.
2015). Toutefois, l’édition des notes de Hildegarde de Bingen par Higley (fév. 2008),
elle-même créatrice de langue, prend le temps de replacer les travaux de l’abbesse dans
le contexte plus large de la création de langue, et présente une sélection d’idéolangues
de Thomas More à la Conlang Mailing List (2.2).
Chapitre 3
Classifications des langues inventées
À partir du moment où l’on constate que les buts et méthodes de chaque idéolin-
guiste peuvent se démarquer de celles de leurs prédécesseurs, si l’on veut garder trace
des filiations et inspirations et pouvoir décrire de nouvelles créations à venir, une clas-
sification rigoureuse s’impose. Cependant, les personnes s’étant intéressé à la question,
dans un cadre académique ou non, l’ont traitée selon des angles différents. Cette section
propose une synthèse des classifications trouvées dans Sidorova & Šuvalova (2006),
Stria (2013), Peterson (2015), et dans l’article Idéopédia « Typologie des idéolangues »
(Anoev et al. 2016). On ne mentionnera pas les classifications typologiques plus clas-
siques comme les degrés de représentation morphologique, de fusion, d’allomorphie et
de synthèse (Velupillai 2012) qui concernent aussi les langues naturelles.
3.1 Les classifications par buts recherchés
Comme nous l’avons montré dans la section 2.1, les créateurs de langues construites
ne les destinent pas toutes au même usage. Les classer par but est la première approche
possible, se basant sur les indications du créateur lui-même, quoique rien ne puisse em-
pêcher par la suite d’employer une idéolangue dans une nouvelle optique.
47
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
48
3.1.1 Langues auxiliaires
Il s’agit des idéolangues qui viennent en premier à l’esprit des gens lorsqu’ils en-
tendent « langue construite ». La grande publicité qui leur a été faite au début du siècle
dernier en est la cause (cf 2.1.3). Contrairement aux autres idéolangues, leur but pre-
mier est la communication, tout est donc fait pour faciliter l’apprentissage de la langue
par le plus grand nombre de personnes : simplicité et régularité des règles grammati-
cales, phonologie accessible à la majeure partie des locuteurs potentiels et vocabulaire,
sinon reconnaissable (langues a posteriori), alors construit selon des règles simples et
prédictibles.
Toutes les langues auxiliaires ne cherchent pas à servir pour le monde entier. Cer-
taines, comme l’afrihili et l’uropi, se cantonnent à un seul continent envisagé comme une
entité politique (Afrique et Europe respectivement). D’autres comme les interlangues
slaves (par exemple le slovianski) tirent avantage de l’intercompréhension déjà présente
dans une famille de langue.
3.1.2 Langues expérimentales
On appelle langue expérimentale une idéolangue dont le but est de tester une hy-
pothèse linguistique ou cognitive. L’expérience est considérée comme un succès si la
langue peut être utilisée sans perte de pouvoir expressif par rapport à une langue natu-
relle tout en remplissant les critères de départ.
Par exemple, le kēlen de Sylvia Sotomayor part du principe d’une langue sans verbes,
et le produit final a pu être utilisé pour un certains nombre de traductions et de textes
originaux en n’utilisant que quatre « relationnels », opérateurs de transitivité totalement
désémanticisés : LA « existence », NI « changement de X », SE « don de X (à Y par
Z) » et PA « X contenant Y » 41. Leur désémantisation n’empêche pas certains, comme
41. http://www.terjemar.net/kelen.php [consulté le 16/07/2017]
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
49
Šuvalova 42, de considérer que « relationnel » n’est qu’un autre nom pour « verbes ».
L’ithkuil de John Quijada a été créé dans le but de faire correspondre de la façon
la moins ambigüe et redondante possible les cheminements de la pensée à la parole
exprimée, avec pour résultat une langue qui encode un nombre énorme d’information
par mot, qui va de 32 aspects verbaux à 9 degrés de comparaison des adjectifs (ou autres
parties du discours) 43.
Le láadan a été conçu par la linguiste et auteur de SF Suzette H. Elgin comme une
langue intrinsèquement féministe, permettant l’expression facilitée d’impressions et de
concepts liés à la féminité telle qu’elle l’envisageait (Okrent 2009, chap. 22). Elle avait
posé, comme critère de réussite de son expérience, l’appropriation de la langue par une
communauté féministe au bout de dix ans, ce qui ne fut pas le cas.
Le loglan et le lojban, déjà mentionnés en 2.1.2, cherchaient à être des langues basées
sur la logique des prédicats ; le lojban a tout de même emprunté au láadan le concept
d’attitudinal, ces particules phrastiques exprimant l’attitude et les émotions du locuteur
vis-à-vis de son message, ce qui n’a rien à voir avec la pure logique (ibid., P. 249).
3.1.3 Langues artistiques
Lorsqu’une idéolangue fait partie d’une œuvre de fiction, et qu’elle se retrouve prin-
cipalement dans son univers, on parle de langue artistique. Ne rentre donc pas en compte
les cas d’idéolangues extérieures à l’univers de l’œuvre que l’écrivain ou le scénariste
aura inclus dans son travail, comme l’espéranto, langue auxiliaire, des annonces pu-
bliques dans le film Bienvenue à Gattaca (USA 1997, Andrew Niccol), ou l’ithkuil,
langue expérimentale, du roman de science-fiction Beyond Antimony de John & Paolo
Quijada (2012).
Les langues artistiques sont toujours fictionnelles, ce qui signifie qu’elles se pré-
42. Source : communication personnelle.
43. http://www.ithkuil.net/ [consulté le 17/07/2017]
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
50
sentent comme tout à fait réelles dans le cadre de l’univers où elles prennent place.
L’effort consenti par le ou les auteurs à la création d’une langue n’est cependant pas
toujours à la mesure de ces prétentions : alors que le réalisateur d’Avatar (USA 2009)
prit la peine d’embaucher un linguiste professionnel, Paul Frommer, pour inventer la
langue des extra-terrestres Na’vi et traduire leurs dialogues, et que Elgin, linguiste, créa
le láadan elle-même pour sa série de romans Native Tongue (1984), la plupart des auteurs
décident de s’inspirer d’une seule langue dont il vont recopier le vocabulaire mot pour
mot, changer quelque peu l’orthographe si besoin en ajoutant des apostrophes au milieu
des mots, et calquer la grammaire sur celle de leur langue maternelle, comme l’ancien
langage de la série de fantasy Eragon (USA 2003-2011) de Christopher Paolini, sur la
base du vieux-norrois.
3.1.4 Langues personnelles
Cette catégorie concerne les idéolangues employées pour le plaisir du créateur seul.
Elles ne sont pas forcément associées à une diégèse ou à un peuple imaginaire. La limite
avec les langues artistiques est floue lorsque la langue personnelle est plus tard employée
comme élément d’une œuvre de fiction ; on prendra en compte l’antériorité de la langue
à l’œuvre, comme dans le cas des langues elfiques de Tolkien, ébauchées bien avant
les romans qui les accueilleront (dès 1915) et furent même la cause de l’invention de la
mythologie de la Terre du Milieu (Tolkien, Fimi et Higgins 2016, P. xvii).
Inversement, le dothraki et le haut-valyrien de Games of Thrones sont des ajouts qui
servent à enrichir l’œuvre, mais n’en sont pas la base. L’auteur du Trône de fer (USA
1996), Georges R.R. Martino, n’avait fait qu’inventer quelques mots dans ces langues en
soignant plutôt l’aspect esthétique obtenu : hrakkar, khalakka dothrae mr’anha, rakh haj
sont dothraki, dracarys, valar dohaeris sont valyriens, et il y a encore les noms propres ;
lors de la transposition en série télévisée, il fallut engager un idéolinguiste pour en faire
des langues utilisables (Peterson 2015, P. 261). Ce sont sans conteste des langues pu-
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
51
rement artistiques.
Les langues personnelles, au contraire des autres types, sont peu évoquées avant
l’arrivée d’internet, puisqu’elles n’ont pas à se confronter à un public pour exister, et
que leur existence, apparemment sans objet, est difficile à défendre pour leur créateur
devant la curiosité générale, par peur de passer pour un illuminé ; Tolkien donna comme
exemple l’unique occasion où il croisa la route d’un autre idéolinguiste, lors de son
service militaire, un homme qui avait murmuré après un temps de réflexion « Oui, je
pense que je devrais exprimer le cas accusatif par un préfixe ». Mais devant l’intérêt de
Tolkien, l’homme, réticent, n’en voulu pas dire plus (Tolkien, Fimi et Higgins 2016,
P. 7). L’ouvrage de Yaguello, une linguiste, paru sous le titre Les Fous du langage, des
langues imaginaires et de leurs inventeurs pour la première fois en 1984, puis pour
la réédition comme Les langues imaginaires : mythes, utopies, fantasmes, chimères et
fictions linguistiques (2006), montre plutôt bien quel genre d’attitude condescendante
et/ou navrée était réservée aux inventeurs de langues (personnelles ou autres) à cette
époque.
3.2 Les classifications par méthode de création du voca-
bulaire
La deuxième méthode de classification des idéolangues se fonde sur le matériel uti-
lisé par les créateurs comme base de travail.
3.2.1 Langues a priori
On distingue, dans les idéolangues dont le vocabulaire ne dérive pas des langues na-
turelles, dans un premier temps les langues philosophiques, qui sont a priori strictes en
ceci que le vocabulaire est construit rationnellement à partir d’un nombre limité d’élé-
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
52
ments qui s’assemblent toujours selon la même logique.
Dans un second temps, le terme a priori a été aussi employé pour les langues dont
les procédés de création de racines et de dérivation/composition sont plus arbitraires,
imitant ce qui se fait dans les langues naturelles : Le kotava, langue auxiliaire, est l’une
d’entre elles, la majorité des langues artistiques également, comme on peut le voir en
annexe F.
3.2.2 Langues a posteriori
Une langue a posteriori emprunte ses éléments de base à des langues naturelles. Cette
stratégie est très courante pour les langues auxiliaires, dans le but de faciliter la recon-
naissance des mots pour l’apprenant ; les racines peuvent provenir d’une seule aire lin-
guistique, comme la famille des langues slaves pour le slovianski, l’Europe pour l’uropi,
l’Afrique pour l’afrihili, ou bien emprunter à un plus large panel de langues comme le lo-
jban, qui construit ses lexèmes en tirant de façon équilibrée des éléments des six langues
mondiales que sont le chinois, l’anglais, le hindi, l’espagnol, le russe et l’arabe. Pour ce
dernier exemple, on a le mot bangu « langue », qui est une moyenne de yǔyán – language
– bhāṣā – lengua – язык (jazyk) – نﺎﺴِﻟ (lisān) 44.
Cela peut aussi se retrouver dans les langues artistiques ou personnelles, ou même ex-
périmentales, par exemple dans le cas des uchronies, où une Histoire alternative conduit
à une histoire linguistique différente : l’univers collaboratif d’Ill Bethisad 45 montre ainsi
des idéolinguistes imaginer ce que serait devenu une langue romane parlée en Pologne
(Wenedyk) ou au Pays de Galles (Brithenig).
44. https://mw.lojban.org/papri/Lojban_etymology [consulté le 17/07/2017]
45. http://bethisad.com/
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
53
3.2.3 Langues mixtes
On parle de langues mixtes quand les deux stratégies précédentes se mêlent. Par
exemple, dans le cas de l’aneuvien, langue personnelle, on peut trouver des mots venant
de langues naturelles (hœnd « chien », de l’allemand, moràl « moral », du français) et
des mots totalement a priori (strægen « train »), ainsi que des mots provenant d’autres
langues construites (zàw « atome », de l’elko, langue expérimentale) et des stratégies
originales de dérivation comme l’iconisme visuel (lililil « dossier »), l’anacyclique (vid
« diable », de div « dieu ») 46.
On peut aussi appeler « mixtes » les langues dont les racines sont a posteriori, mais
les morphèmes grammaticaux a priori, comme le volapük.
3.3 Classification par organisation de la grammaire
Enfin, la dernière dimension classificatoire concerne la manière dont sont assemblés
et présentés les éléments de base de la langue.
3.3.1 Langues schématiques
Si une idéolangue a comme but d’avoir le plus de régularité possible, sans excep-
tions, Stria (2013) la dit schématique. Une telle rigueur est, à de rares exceptions près,
recherchée par toutes les langues auxiliaires afin de les rendre plus faciles à apprendre.
Ainsi, la grammaire de l’espéranto, langue a posteriori, est dite pouvoir se résumer en 16
règles (rassemblées dans un document appelé le fundamento), sans exceptions ; cepen-
dant, cette concision exige d’être déjà familier avec la grammaire des langues d’Europe
de l’Ouest. Le kotava, langue a priori, ne peut pas être décrite sur ce modèle des langues
46. http://www.europalingua.eu/ideopedia/index.php5?title=IDEO_ANV_
Vocabulaire [consulté le 17/07/2017]
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
54
occidentales et sa grammaire demande plus de règles afin de parer à toutes les situations,
mais le résultat cherche tout autant la régularité.
Les langues expérimentales tendent aussi à la systématisation pour ne pas distraire
de leurs objectifs expérimentaux : C’est le cas du lojban/loglan et de l’ithkuîl, mais pas
du kēlen et du láadan qui possèdent un objectif artistique en parallèle.
3.3.2 Langues naturalistes
Si la schématisation peut donc être perçue comme un obstacle à l’esthétisme, la der-
nière catégorie de langues construites la rejette en faveur du naturalisme, c’est à dire
l’imitation du développement des langues naturelles. Ainsi le manuel de Peterson (2015),
destiné aux créateurs de langues artistiques, se concentre quasi-exclusivement sur celles-
ci. On cherche à arriver à une langue qui pourrait être parlée par des humains en lui appli-
quant des processus diachroniques comme les changements phonétiques, les glissements
sémantiques, les emprunts, eccetera. Le résultat est toujours jugé (par le créateur et ses pairs)
à l’aune des langues naturelles existantes. Si un point de la grammaire semble violer
un universal linguistique (absolu ou relatif), il doit être explicable comme conséquence
logique de la structure de la langue elle-même. C’est également cette méthode qui per-
met de créer des familles entières de langues liées entre elles par des liens génétiques ou
aréaux, comme les langues elfiques de Tolkien.
3.4 Bilan
Les idéolangues (terme employé par leurs adhérents francophones) répondent à des
besoins très divers, non seulement la communication, mais aussi la recherche d’un aspect
esthétique, ou l’analyse de leur fonctionnement pour lui-même : il peut s’agir d’un hobby
comme d’une entreprise sérieuse visant à changer le monde ou les sciences. En surface,
cela conduit à des résultats très différents, que l’on ne peut pas forcément comparer selon
CHAPITRE 3. CLASSIFICATIONS DES LANGUES INVENTÉES
55
les mêmes critères ; et leur construction ne se déroule pas de la même façon. Toutes les
langues construites, cependant, cherchent ou prétendent à pouvoir être utilisables par
des locuteurs. Certaines d’entre elles sont conçues pour donner l’illusion de la langue
naturelle, non-construite, dès leur description, sans nécessiter de passer par une situation
de communication réelle (cette dernière étant ce qui permet, quand elle est menée à bien,
de parler de langue sans distinction d’origine) ; elles sont dites naturalistes et sont les
plus à mêmes de servir de pont entre la linguistique concrète et le côté « loisir » de
l’invention, si l’on s’intéresse à la manière dont les découvertes de la linguistique sont
appliquées à la création de langues.
Deuxième partie
Expérience pratique
56
Chapitre 4
Présentation et objectifs
L’expérience se déroule en deux temps. La première partie se propose de décrire pas
à pas la création d’une langue de type naturaliste (cf. 3.3.2), non-dérivée d’une langue
existante, parlée dans un contexte fictionnel. Le produit fini, présenté en annexes, est une
grammaire descriptive (annexe A) ainsi qu’un dictionnaire devant atteindre 1500 mots,
tous dotés d’une étymologie motivée intra-diégétiquement (annexe C). Afin de rendre
le résultat plus tangible encore, l’annexe B contient un ensemble de textes courts, tra-
ductions et œuvres originales commentées (d’un point de vue linguistique et stylistique).
La seconde partie de l’expérience vise à vérifier si la langue (ci-après désignée par le
glottonyme tüchte, orthographe germanisante pour une prononciation [ˈtyxtə], signifiant
« parole, langue »), ainsi présentée, ne peut être distinguée d’une langue existante.
4.1 Motivation des prémisses
Plusieurs paramètres ont été réglés dès le départ. Par exemple, le choix d’une langue
naturaliste est justifié par l’absence de travaux académiques de cette ampleur à leur su-
jet, au contraire de ce qui a pu se faire pour des langues destinées à tester une hypo-
thèse cognitive, que ce soit une langue logique comme le loglan de James Brown (J. C.
57
CHAPITRE 4. PRÉSENTATION ET OBJECTIFS
58
Brown 1960 ; Okrent 2009, chap. 19) ou une langue simplifiée à vocation auxiliaire
(J. R. Brown 2015). Dans le premier cas, il s’agissait de vérifier l’influence d’une langue
construite selon le principe de la logique des prédicats sur les capacités cognitives des lo-
cuteurs (recherche non-aboutie) ; dans le second, de savoir si la simplicité et la régularité
d’une langue dite a posteriori 47 (cependant non pas basée sur les langues européennes
comme l’espéranto, mais polynésiennes) était corrélée significativement avec la facilité
d’apprentissage, le résultat étant que seuls les facteurs externes (nombre de langues déjà
parlées, degré de complétude des langues créées 48) avaient une influence significative
sur le résultat de l’apprentissage.
Dans ce travail, le tüchte ne sert pas à prouver une hypothèse à partir d’une gram-
maire ad hoc, son intérêt premier réside dans la description de son processus de construc-
tion, dont l’application n’a jamais été présentée dans ses moindres détails par les idéo-
linguistes s’en réclamant 49 ; de façon secondaire, il s’agit d’une langue artistique sans
prétentions politiques ou scientifiques (autres que dans le cadre de ce mémoire). In-
suite, le choix de ne pas débuter les processus pseudo-diachroniques avec une langue
naturelle existante (a posteriori, comme le ferait quelqu’un désireux de créer un français
futuriste par exemple) s’explique par la possibilité de décrire non pas une seule méthode
de construction, qui est la pseudo-diachronique, mais une autre sensiblement différente
et plus répandue, qui est l’invention a priori. Enfin, c’est par anticipation du travail de
documentation nécessaire pour la construction du lexique que la peuplade fictionnelle
parlant le tüchte a été localisée dans les environs de l’Alsace : l’histoire linguistique de
la région est bien documentée, et il est plus facile pour le chercheur basé sur place de ré-
cupérer des informations de première main sur l’environnement physique ainsi que sur
les métiers traditionnels, deux domaines lexicaux pour lesquels une relexification (cf.
1.8.2) du français ou d’une autre langue moderne est moins que jamais souhaitable afin
47. cf. 3.2.
48. La plupart des participants à l’étude étaient des idéolinguistes.
49. Citons Peterson (juil. 2014) et Rosenfelder (2015).
CHAPITRE 4. PRÉSENTATION ET OBJECTIFS
59
de préserver l’illusion de la réalité, indispensable au but naturaliste visé. Mais d’autres
prémisses ne sont pas aussi contraintes : ainsi, l’aspect esthétique de la langue, l’évolu-
tion de sa grammaire à travers des siècles simulés, tout cela est à la discrétion de l’auteur
qui pourra explorer librement les structures linguistiques qui lui paraîtront les plus inté-
ressantes, car la construction de langue peut (et devrait) également être un plaisir.
4.2 Première tentative
Une première itération de la langue avait été ébauchée avant d’être abandonnée pour
la version actuelle. Se basant sur les mêmes postulats intra-diégétiques (situation et mode
de vie des locuteurs) que la présente incarnation, elle en différait par tout ce qui est
interne à la langue (phonologie, grammaire et vocabulaire), par la méthode de stockage
du vocabulaire (cf. 5.2.2), et par le fait que la phonologie d’arrivée (plus quelques règles
grammaticales et des termes du vocabulaire) t=n avaient été définies par avance.
Plus de mille mots furent créés, ainsi qu’assez de règles de grammaire pour composer
des phrases simples, et un schème de règles de changement phonétiques de t=0 à t=n ;
cependant, le stade initiale de la construction ne fut jamais dépassé.
En raison d’un manque de motivation pour continuer à développer la langue telle
qu’elle était devenue, il a été décidé de tout recommencer sur de nouvelles bases. Dans
la communauté des créateurs de langue, il s’agit d’un des trois résultats possibles ob-
servés : certains idéolinguistes n’iront jamais rien changer qu’ils ont un jour ajouté à la
grammaire (deyryck), d’autres bricolent sans fin, revenant sur des points plus ou moins
majeurs de leur langue (aneuvien), enfin, le cas de figure présent est celui de l’abandon
suivi d’un nouveau projet.
Chapitre 5
Protocole expérimental
5.1 Déroulement chronologique
Pour décrire les processus pseudo-diachroniques, il eût été impensable d’utiliser une
échelle de temps renvoyant à un nombre d’années fictif ; une écriture aussi immersive
n’a sa place que dans la grammaire finale, rédigée selon le point de vue d’un gram-
mairien intra-dégétique. Aussi, pour ordonner les différents stades du développement
pseudo-diachronique, c’est une échelle abstraite
duée comme suit : <0> est le stade initial, et
contemporain. Entre ces deux extrémités, les numéros d’échelons sont à comprendre
comme représentant un espace de trente ans, c’est-à-dire plus ou moins une génération,
le temps de mettre en place un changement phonétique. C’est en effet cet aspect de la
diachronie qui a été choisi comme étalon, afin de placer exactement les emprunts lexi-
caux sur l’axe du temps dans le lexique ; la forme de ces derniers dans les évolutions
postérieures de la langue en dépendent directement, d’où l’importance de la précision.
60
CHAPITRE 5. PROTOCOLE EXPÉRIMENTAL
61
5.2 Outils informatiques
La création de la langue, si elle ne peut être automatisée complètement, bénéficie de
l’aide de l’informatique pour certains processus fastidieux.
5.2.1 Phonétique et phonologie
Le passage de la phonologie du tüchte du stade t=0 au stade t=n doit obéir à la régula-
rité des changements phonétiques telle que présente dans les langues naturelles. À cette
condition apparaîtront comme naturellement des cas d’allomorphie, de réanalyse par
perte de la régularité des dérivations, des paradigmes seront refaits de par la confusion
de désinences. Les règles de transformation phonologique sont exprimées en linguistique
historique par la formule
Des programmes existent qui permettent d’automatiser le passage des règles sur un
texte, tous créés par des idéolinguistes dérivant de nouvelles langues à partir d’anciennes.
Une liste non exhaustive de ces programmes est en ligne sur FrathWiki 50, un des wikis
de la sphère des créateurs anglophones. Parmi eux, notre choix s’est porté sur le SCA2,
une application java en ligne 51, présentée dans Rosenfelder (Rosenfelder 2012, P. 260-
267). Son fonctionnement repose sur la définition préalable de catégories sous la forme
X=abcd…, où X est un symbole de catégorie – par exemple, les consonnes fricatives
– et abcd une suite de graphèmes symbolisant des phonèmes, suivie par l’écriture de
règles sous la forme :
Ce format est obligatoire et peut être augmenté d’une quatrième position signalant les ex-
ceptions à la règle, sous la forme /
50. http://www.frathwiki.com/Main_Page [consulté le 04/03/2018]
51. http://www.zompist.com/sca2.html [consulté le 28/06/2017]
CHAPITRE 5. PROTOCOLE EXPÉRIMENTAL
62
autres symboles comme les points de suspension … signifiant « nombre indéterminé de
symboles », ² signifiant « symbole précédent géminé », \\ commandant la métathèse
des graphèmes de départ. Les règles sont ensuite appliquées à un texte composé de mots
séparés par des espaces ou des retours à la ligne, facultativement suivis de ‣ qui introduit
une glose (à laquelle les changements ne s’appliqueronnt pas) et qui restera intacte dans
le texte résultant. Il est aussi possible, avec d’autres paramètres, de souligner les mots
ayant été affectés différemment lors de deux itérations successives du programme, ou de
décortiquer pas à pas quelles sont les règles s’étant appliquées à chaque mot. L’annexe
E donne le fichier brut de ces changements pour l’histoire du tüchte.
5.2.2 Lexicologie
La présentation du dictionnaire final n’est pas à définir dès l’abord ; pour des raisons
méthodologiques et afin de faciliter la lecture aux personnes découvrant la présente re-
cherche, le système de stockage des mots inventés ou dérivés au fur et à mesure doit
permettre la plus grande exhaustivité possible et être assez souple pour intégrer de nou-
veaux champs.
Un logiciel envisagé, mais non sélectionné, pour ce travail est LexiquePro, développé
par le SIL 52. Se présentant comme un éditeur de base de données avec des balises pré-
programmées pour la lexicologie (formes, pluriels, traductions, exemples, homonymes,
champs lexicaux, ecc.) ses points forts sont la facilité avec laquelle une multitude de dic-
tionnaires inverses sont créés, la possibilité d’importer des fichiers image, son et vidéo,
et d’exporter un dictionnaire mis en forme comme fichier Word ou HTML. Son point
faible est la restriction du nombre de balises prises en compte pour le tri, qui empêche
par exemple de classer les mots par période d’entrée dans la langue, ainsi que le fait qu’il
n’ait pas été conçu pour accommoder les variations diachroniques.
Ensuite, le lexique de la première version de l’expérience (cf. 4.2) fut stocké dans
52. https://www.sil.org/
CHAPITRE 5. PROTOCOLE EXPÉRIMENTAL
63
un tableur Excel, avec les avantages qu’il était possible d’ajouter autant de champs que
nécessaires en colonne, et de trier le lexique de n’importe quelle manière. Cependant, il
devint évident qu’à mesure que les variantes diachroniques s’accumuleraient, le nombre
de colonnes rendrait le fichier illisible.
Enfin, le choix s’est porté sur une simple arborescence XML. Ce format est facile-
ment convertible en une multitude d’autres grâce aux feuilles de style XSL. En conver-
tissant vers le HTML, même pendant la rédaction, on a une interface plus lisible (tri
des entrées, mise en forme du texte). Comme avec LexiquePro, il est possible d’intégrer
images et son que l’on retrouvera dans le fichier d’arrivée. Les autres avantages sont les
mêmes que ceux d’un tableur. La figure 5.1 montre un exemple de mot ainsi rangé.
tsē
Figure 5.1 : Un mot dans le dictionnaire XML
CHAPITRE 5. PROTOCOLE EXPÉRIMENTAL
64
5.3 Organisation du lexique
5.3.1 Lexique de travail
Les mots créés sont stockés dans le fichier XML avec une arborescence minimale
indiquée en figure 5.2 :
Figure 5.2 : Arborescence minimale d’une entrée dans le lexique
— L’élément
date (date de création de l’entrée sous le format aaaa-mm-jj). Il contient un ou
plusieurs éléments
— L’élément
l’attribut t). Il contient toujours les éléments