« Il y a plus de mots arabes que de gaulois dans la langue française », claironne la journaliste Ouafia Kheniche depuis l’antenne de France Inter, à l’occasion de la Journée mondiale de la langue arabe (17/12/2017). Un an plus tard, sa consoeur du Figaro, Claire de Montgolfier, enfonce le clou : il y a « deux fois plus de mots d’origine arabe que de mots d’origine gauloise » dans la langue nationale (article du 30/7/2018).
La source ? C’est la même pour les deux journalistes : Jean Pruvost, « lexicologue et professeur émérite », expert attitré de France Inter, auteur du livre « Nos ancêtres les Arabes, Ce que notre langue leur doit ».
Si l’on cherche à contrôler ces affirmations et à établir une statistique, les choses deviennent plus compliquées. Selon Claire de Montgolfier, « plus de 400 mots » sont passés de la langue d’Al Maari à celle de Molière. Ouafia Kheniche cite Pruvost qui recense au doigt mouillé « 500 mots, et même davantage ».
Evidemment, la lexicologie n’est pas une science exacte, le journalisme encore moins. Il y a forcément une part d’arbitrage et d’appréciation personnelle. Combien de mots français toutes origines confondues ? 32 000 lit-on couramment. Mais ce chiffre peut être gonflé ou minimisé en fonction des critères retenus.
C’est pourquoi il vaut mieux aller juger sur pièces. EspaceFrançais.Com, un site libanais sur la langue française, met à disposition une liste de 446 mots arabo-français, établie à partir de travaux de lexicologues. On trouve une liste assez proche sur Wikipédia, avec des définitions et des informations (incomplètes) sur l’étymologie.
Et les mots gaulois ? Pour l’expert Jean Pruvost, « c’est à peine une centaine de mots ». Deux listes sont disponibles sur internet, qui se recoupent à peu près : celle de trois professionnels de la langue française qui regroupe 187 mots et celle du site l’Arbre celtique qui en recense 219.
Des statistiques de mots arabes à diviser par 5…
219 contre 446 : les Gaulois devraient donc faire comme à Alésia et concéder leur défaite…
En réalité les choses sont plus complexes. Les listes n’ont pas les mêmes critères et ne sont donc guère comparables sans discussion préalable.
La liste des mots arabes du site libanais comprend par exemple 11 mots dérivés d’un nom de lieu, comme « algérien ». A ce compte, on pourrait faire des listes sans fin d’adjectifs tirés de noms gaulois, comme « parisien », « nantais » ou « auvergnat », en y ajoutant des dizaines de milliers de gentilés de village, ainsi que tous les fromages et autres spécialités qui sont baptisées d’après leur patelin d’origine (comme le café moka, qui vient d’une ville du Yémen).
La liste libanaise comprend surtout une majorité de mots spécifiques à la civilisation arabe (autour de 261). Certains sont dans nos dictionnaires depuis longtemps mais n’ont pas dû beaucoup en sortir : à quoi peut ressembler un zinzolin ou un alquifoux ? D’autres sont davantage utilisés, comme oued, erg ou reg, du moins par les géographes et par les adeptes des mots croisés. D’autres enfin remplissent nos journaux et s’imposent à nos esprits, alors qu’ils étaient inconnus du grand public il y a seulement une génération : djihad, fatwa, hadith, halal, kouffar (qui désigne l’incroyant et qui a donné aussi cafard) …. Mais n’est-il pas subjectif ou au moins prématuré de les inscrire dans le périmètre de la francité ?
A ce compte encore, de sushi à quinoa, de yoga à samouraï, tous les mots spécifiques de toutes les civilisations de la Terre sont susceptibles d’être naturalisés français, puisque la mondialisation explose les frontières … Sur cette base, cependant, il sera difficile de fixer une statistique crédible et on ne jugera la réalité de la langue que d’après le seul présent – un défaut habituel au journalisme et aux experts médiatiques…
Poursuivons la lecture de la liste libanaise. Quelques dizaines de mots (36) sont également très typés, tout en étant bien intégrés dans la langue populaire, gentiment désuets ou en pleine émergence. Ce sont des termes d’argot de caserne des troupes coloniales (bled, souk, gourbi, macache, toubib, maboul…) et, de plus en plus, d’argot de banlieue. La liste n’est d’ailleurs pas à jour, car toute une série d’expressions sont en train de passer dans la langue jeune : le pas très charitable « Cheh ! » (« Bien fait ! »), s’entend dès la primaire, même au fin fond de la Bretagne. On trouve également « chouf » qui désigne l’assistant indispensable du détaillant de drogue, celui qui guette à toute heure, Covid ou pas Covid…
Des mots « arabes » qui n’en sont pas…
Au final, si l’on reste aux mots d’usage vraiment commun, vraiment bien assimilés et même indispensables, dans un registre de langue normal, on compte largement plus d’une centaine de mots ayant un passé arabe (j’en compte 133 à partir de la liste libanaise) : sucre, zénith, azur, café, abricot, alcool…
Cela reste impressionnant et on y compte un tas de mots des sciences et des techniques, datant de l’âge d’or de la civilisation arabe. Ils ont été adoptés il y a longtemps, ont été digérés au point de ne plus être identifiés comme étrangers pour la plupart.
Mais là encore on peut chipoter. Zéro et chiffre viennent d’un même mot arabe…qui a été emprunté au sanscrit, la langue classique des Indous. Aubergine vient de l’Iran préislamique. Noria vient du syriaque, la langue de la Syrie préarabe. Guitare est emprunté aux Byzantins de langue grecque. Sagaie ou couscous viennent du tamazight, la langue ancestrale des Berbères. Café est tiré du nom d’une région de l’Éthiopie, également sous la dépendance de l’empire arabe à son apogée.
Comme le français, l’arabe a été une langue impériale, emportant dans ses bagages quantité de mots-butins razziés aux 4 coins du califat.
A noter qu’algèbre ou algorithme sont 100 % arabes, ce qui montre qu’ils ont eux aussi fait avancer le progrès.
Si l’on est un peu strict sur les droits d’entrée dans le dictionnaire français, en contrôlant les origines, en retenant les mots réellement incorporés au français et à la civilisation qu’il exprime, au « génie de la langue » comme on disait autrefois, on aboutit à quelques 73 mots pleinement français d’origine vraiment arabe. Plusieurs sont vraiment précieux et leur musicalité expressive manquerait à la prosodie française : albatros, algarade, ambre, azimut, mousseline, nacre, récif…
Une onde de mélancolie nous envahit d’un seul coup : de zénith à zob et de nacre à niquer, il y a quand même eu une descente en gamme, et c’est triste pour la civilisation arabe comme pour la civilisation française…
Chercheur à l’Université de Bourgogne, Jacques Lacroix présente son livre. Il révèle avec chaleur les merveilles celtes enfouies dans notre langue.
Les Gaulois n’ont pas dit leur dernier mot
Récapitulons : 219 mots gaulois contre 73 mots arabes. Nos ancêtres ne sont pas aussi craignos* que certains affectent de croire, surévaluant les uns et dévalorisant les autres.
Et encore, on est loin du compte. Car les 219 sont très vraisemblablement un minimum. Et on commence à suspecter que le battage (*?) médiatique autour d’un livre France Inter relève moins d’un cheminement* scientifique rigoureux que d’une forme de truande* intellectuelle.
Le comptage à partir du site l’Arbre celtique laisse en effet de côté la plupart des mots dérivés, sens dérivés et locutions. Chacune de ces racines ou presque est la souche * d’autres mots, qui portent fruit à leur tour, donnant naissance à maintes * nuances de langage et à une tonne* d’expressions imagées qui font la langue de tous les jours.
C’est vrai d’ailleurs pour certains mots d’origine arabe qui se sont greffés au chêne * gaulois : amiral a donné vice-amiral, contre-amiral ou amirauté. Mais la plupart sont des oiseaux migrateurs qui se posent en solitaire sur une branche du dictionnaire : « moucharabieh » par exemple n’a donné qu’un mot, nos ancêtres n’en ayant guère l’usage.
Les mots gaulois, qui appartiennent au noyau le plus fondamental de notre langue nationale, ont toute chance d’être les plus féconds. Balai * donne balayer, balayette, balayure, balayage… Raie * donne rayure, rayon (1), rayonnement, rayonnage, rail, déraillement, éraillé…Lance* donne lancement, élan, élancé, lanceur, lancinant, relance, élancement… Notre bonne vieille galette vient de galet *, avec qui elle partage un aspect plat et rond.
La langue de Vercingétorix trouve ainsi encore sa place sur les terrains de foot comme dans les salons de coiffure, dans les supermarchés, gares, chantiers (*?), stations spatiales, crêperies, chez les kinés ou au ministère de l’économie, dans le concret aussi bien que dans l’abstrait.
Mots dérivés et racines oubliées…
Et ce n’est pas tout. Car les 219 sont des mots attestés dans l’ancien français, qu’on ne peut expliquer par le latin et qu’on peut rapprocher d’autres langues celtes. Or il y a beaucoup de mots qu’on peut expliquer par le latin et sur lesquels on peut malgré tout s’interroger.
Roi se dit rex en latin, rix en gaulois. Mère se dit respectivement mater et matir. Joug (d’où conjoint), se prononce jugum pour César, iougo pour Vercingétorix. Battre viendrait du latin battuere selon certains dicos, ou d’un verbe gaulois disparu qui a son équivalent en breton et en irlandais, selon d’autres. Changer est attribué au latin cambiare par le Larousse, mais Le Robert (2) trouve à cambiare lui-même une origine celte (il est alors à rapprocher du breton kemma). Le latin, mieux documenté, plus prestigieux, rafle en général la mise dans les arbitrages des étymologistes, selon un snobisme datant de la Renaissance (3).
Ainsi aux 219 on pourrait vraisemblablement ajouter des dizaines (?) d’autres racines.
Suivons maintenant le même chemin* pour battre (* ?) que pour galet et prenons en compte ses quelques 50 dérivés : bataille, combattant, battant, battement, moissonneuse-batteuse, batterie, abattement, abats, abat-jour, abattant, débat, ébats, rabat-joie…
Faisons la même opération pour tous les autres mots d’allure celte que nous glanerions* dans le dico : par le jeu des multiplications, c’est potentiellement plusieurs centaines à quelques milliers de mots supplémentaires dont il faudrait créditer le gaulois…
Enora P.
-
Rayon est tiré de la racine gauloise qui a donné raie selon certains dictionnaires, ou du mot latin radius selon d’autres.
-
Le Robert, Dictionnaire d’étymologie, 2009, Jacqueline Picoche. Une vraie mine, plus instructive que le latinolâtre Larousse.
-
C’est aussi à cette époque que les savants commencent à introduire massivement dans les dicos des mots pompeux tirés du latin classique. Par exemple, plutôt que de partir du mot celte cheval * existant dans la langue populaire, on va repêcher la racine latine equus pour inventer le mot équitation. Une manière, déjà, de se distinguer des bouseux *, qui va orienter la langue française vers une abstraction toujours plus grande – à la différence de l’anglais, plus concret et plus parlant.
Plus conservateur, le gallo, langue qui fait tampon entre le breton et le français, comprendrait jusqu’à 8 % de mots gaulois. Ce site donne quelques exemples.
Crédit photo : DR (photo d’illustration)
[cc] Breizh-info.com, 2021, dépêches libres de copie et de diffusion sous réserve de mention et de lien vers la source d’origine
4 réponses à “Débunkage. Plus de mots arabes que de gaulois dans la langue française, vraiment ?”
Merci beaucoup (!!!) Enora P. pour ce texte vraiment très intéressant qui remet les pendules à l’heure.
Albatros, mot arabe ? L’affirmation paraît rapide. L’étymologie n’est pas certaine. Selon une hypothèse, il pourrait découler du mot espagnol « alcatraz », qui viendrait de l’arabe. Mais selon une autre, sa racine serait le latin « albus » (blanc) et le mot aurait été introduit dans le français via l’anglais. Ce qui commence par « al » n’est pas toujours arabe ! (Alpiniste ? Alcool ? Alambic ?)
Sans compter des mots qui ont une double étymologie, comme « aveugle », qui vient de « ab oculus », c’est à dire «privé d’yeux» en latin. Or aveugle se dit « caecus » en latin, qui n’a rien à voir. Car « ab oculus » est en fait le mot gaulois traduit littéralement en latin pour donner un mot nouveau.
Autrement dit le mot « aveugle » est lexicographiquement latin, mais étymologiquement gaulois.
Ce qui est grave dans cette mise au point, c’est que l’on s’interroge sur la présence dans le Français de mots Gaulois ou Arabes. Que le Français ait une majorité de mots d’origine gauloise ou celte, cela est parfaitement normal… Par contre la présence de mots arabes dans le Français dénonce un appauvrissement de cette langue.