Collocation, cooccurrence et expression idiomatique

Apolline Luthardt2015Auteur :
Apolline Luthardt
Etudiante en cursus interculturel franco-allemand à l’Université Blaise Pascal de Clermont-Ferrand
Stagiaire de juin à août 2015 chez Morlot Übersetzungen

Le langage permet d’exprimer les choses avec une précision extraordinaire. La langue est certainement le langage le plus sophistiqué. Elle fournit une diversité énorme de mots précis, ce qui permet à l’homme d’exprimer tous ses sentiments, toutes ses pensées, et même ce qui n’existe pas dans ce monde, la seule limite à la langue étant celle de l’imagination. Si on peut même parler de ce qui n’existe pas, on peut avoir l’impression que l’utilisation de la langue est complètement libre ; elle l’est, dans un sens, puisque chacun est libre de faire les associations de mots qu’il souhaite. Mais si on veut un énoncé qui fait sens, la langue n’est plus libre. En effet, il y a une certaine compatibilité, ou non, des mots. Cette compatibilité qu’il y a entre certains mots est appelée collocation, c’est-à-dire un rapprochement de termes qui n’est ni fixe, ni fortuit.

La notion de collocation est très liée à celles de cooccurrence d’une part et d’expression idiomatique d’autre part. Elle est, de plus, très importante dans le domaine de la traduction. Il existe également des méthodes de calcul des associations de mots.

I. Différences entre collocation, cooccurrence et expression idiomatique

On confond souvent les termes « collocation » et « cooccurrence », pourtant ils se distinguent. Le mot « collocation » vient du latin collocatio, qui signifie « disposition », et collocare, « placer ensemble ». À partir de là, on pourrait définir la collocation comme étant l’« arrangement des mots ». En fait, une collocation est une cooccurrence privilégiée. On parle de collocation pour exprimer le fait qu’un nom commun s’utilise avec un verbe ou un adjectif particulier, et que cette association a un sens différent de l’addition des sens des deux termes. On peut prendre comme exemple l’expression « une addition salée ». On voit bien ici que c’est une image, et qu’on ne peut pas comprendre cette expression si on additionne la signification des deux termes pris séparément. De plus, il faut constater que cette association de mots n’est pas fortuite, et n’est pas fixe non plus puisqu’on peut dire « une addition très élevée » par exemple.

La cooccurrence est une notion beaucoup plus large. C’est simplement le fait que deux ou plusieurs mots se retrouvent plusieurs fois associés l’un à l’autre dans une unité de texte (qui peut être une phrase, un paragraphe, un texte, un ouvrage, etc.) ou dans la langue habituellement. Le mot « cooccurrence » est composé du préfixe latin co, qui signifie « avec, en même temps » et du mot occurrence, emprunté à l’anglais : « fait de se produire, d’apparaître, de se présenter ». La cooccurrence ne définit donc ni la nature de l’association des mots, ni l’espace dans lequel ils doivent être associés, contrairement à la collocation où l’unité est la phrase. Le sens de l’association des deux mots n’est pas différent de l’addition de celui des deux mots séparément. On peut prendre comme exemple « un signe ostentatoire » : c’est une expression fréquemment utilisée dans la langue française, et dont le sens est très clair. Prenons maintenant un contre-exemple : l’expression « un nuage obèse » n’est pas une cooccurrence. D’usage, ces deux mots ne s’emploient pas associés l’un à l’autre pour exprimer la notion de « gros nuage » ; on dit que les mots « nuage » et « obèse » ne sont pas cooccurrents.

La collocation est donc plus spécifique que la cooccurrence, mais elle ne l’est pas non plus autant que l’expression idiomatique. Cette locution est fixe, c’est une expression (qui peut d’ailleurs contenir beaucoup plus que deux mots) figée dont le sens est souvent très différent de celui de ses éléments pris individuellement. On entend souvent, par exemple, l’expression « avoir du pain sur la planche » qui signifie « avoir beaucoup de travail ». Évidemment, il n’est pas possible de comprendre le sens de cette expression sans apprentissage préalable.

Dans l’ordre, c’est donc l’expression idiomatique qui est la plus figée, et la cooccurrence la plus souple. La collocation est un compromis entre ces deux objets linguistiques.

Voici un tableau récapitulatif de ces trois éléments :

Expression idiomatique Collocation Cooccurrence
Définitions Expression particulière à une langue, qui n’a pas forcément d’équivalent littéral dans d’autres langues
Ensemble des locutions figées dans les usages d’une langue dont la compréhension nécessite une mémorisation préalable
Position d’un mot par rapport à un autre le long de la chaîne parlée
Cooccurrence privilégiée : rapprochement de termes qui n’est ni fixe ni fortuit
Forme d’expression idiomatique causée par une cooccurrence systématique
Séquence de mots consécutifs caractérisés par une unité syntaxique et sémantique et dont la signification ou la connotation ne peut pas être dérivée de la signification de chacune de ses composantes individuelles
Présence simultanée de deux ou plusieurs mots dans le même énoncé
Il n’y a pas forcément de relation syntaxique (expressions, syntagmes figés, collocations) mais un lien linguistique
Mots utilisés dans un même contexte
Quand la présence d’un mot dans un texte donne une indication sur la présence d’un autre mot
Caractéristiques Forme figée, sans variations possibles Le rapprochement des mots A et B apparaît plus fréquemment que les mots A et B individuellement
Pas de traduction mot-à-mot possible
Connues seulement des locuteurs natifs
On ne peut ni remplacer un mot par un synonyme ni ajouter un mot à l’expression ni opérer une transformation grammaticale sur l’expression
Les mots ne doivent pas forcément apparaître dans une unité grammaticale commune, ni dans un ordre particulier
Exemples « découvrir le pot aux roses » = découvrir la vérité
« donner sa langue au chat » = ne pas savoir répondre (devinette, etc.)
« devoir une fière chandelle à qqn » = avoir une dette envers qqn (sens figuré)
« mettre l’accent sur », mais pas « poser l’accent sur »
« donner son accord »
« apprendre sur le tas » = apprendre en pratiquant
« un accent à couper au couteau » = un accent très fort
« la nuit noire »
« un train express, bondé, luxueux, etc. »
« un train à vapeur »
« rater le train »
« le train quitte la gare »

On a vu qu’il y avait des différences fondamentales entre la collocation et la cooccurrence. Toutefois, dans le langage courant, les deux termes sont souvent considérés comme synonymes. Ils ont alors tous les deux le sens de collocation.

II. La collocation dans la traduction

Les collocations sont un facteur très important à prendre en compte dans la traduction d’un texte. Comme on l’a vu précédemment, les collocations sont particulières à la langue et ne peuvent être traduites mot à mot. Cependant, il est important d’utiliser les collocations lors de la rédaction du texte dans la langue cible pour lui donner une consistance, un aspect idiomatique. Le traducteur doit donc faire appel à deux capacités : il doit d’une part comprendre la locution dans la langue source, et d’autre part être capable de la traduire par une expression équivalente mais qui n’est pas l’addition de la traduction de chaque terme individuellement. Les collocations, et encore plus les expressions idiomatiques, sont donc un aspect important de la traduction à ne pas négliger, et jouent un rôle clé dans la qualité du texte final.

Voici des exemples de traduction de collocations :

Français Allemand Mot à mot
tirer un feu d’artifice ein Feuerwerk abbrennen brûler un feu d’artifice
des feuilles mortes Herbstlaub le feuillage d’automne
observer une minute de silence eine Schweigminute einlegen poser une minute de silence
la dernière mode die neueste Mode la mode la plus récente

On voit bien dans ce tableau qu’on ne peut pas traduire les collocations mot à mot et qu’il est donc important de savoir reconnaître et manier correctement ce phénomène linguistique.

Bien sûr, les traducteurs peuvent s’aider d’outils afin de comprendre et traduire les collocations. Il n’est en effet pas toujours évident de traduire une collocation, même en l’ayant comprise, car cela sous-entend de savoir exactement avec quel verbe ou adjectif s’utilise un nom en particulier. Il existe donc des dictionnaires des collocations, en version papier ou en ligne. On peut noter :

III. Mesures d’associations

Les collocations et cooccurrences sont des éléments qui reviennent souvent dans un texte. Certains ont mis au point des méthodes pour calculer leur fréquence d’apparition. Il existe plusieurs méthodes différentes, qui s’appliquent aussi bien aux cooccurrences qu’aux collocations. La mesure d’association est la méthode la plus répandue, et se décline elle-même en plusieurs méthodes. Le procédé de cette méthode, c’est l’observation. C’est une approche statistique du traitement de la langue maternelle, dont les calculs se basent sur les données du tableau suivant :

Mot 2 présent Mot 2 absent
Mot 1 présent nombre de fois où les deux mots apparaissent ensemble
a
nombre de fois où le mot 1 apparaît mais pas le mot 2
b
Mot 1 absent nombre de fois où le mot 2 apparaît mais pas le mot 1
c
nombre de fois où les deux mots sont absents
d

Il faut ensuite définir un « contexte commun » au sein duquel sera effectuée l’observation. Les lettres a, b, c et d représentent chacune une case du tableau et donc un nombre qui correspond au nombre d’occurrences d’une situation définie : combien de fois la situation apparaît-elle dans le « contexte commun » choisi ? Elles représenteront leur case respective du tableau dans les calculs. Il faut ensuite appliquer une formule mathématique (il en existe plusieurs pour cette méthode) qui déterminera la fréquence d’apparition d’une collocation ou d’une cooccurrence. Les différentes formules de calcul existantes sont appelées « le test du X² », « le ratio de vraisemblance » et « l’information mutuelle ». Ces méthodes sont décrites dans la thèse en ligne « Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetés », au
chapitre 4 Cooccurrence de mots