Enseigner la terminologie

88
Enseigner la terminologie pour quoi faire ?

description

Enseigner la terminologie. pour quoi faire ?. 1- Enseigner à qui?. Des spécialistes du traitement de la chaîne documentaire :. traducteurs,. rédacteurs,. qui ne sont pas en principe des spécialistes des domaines dans lesquelles vont s’exercer leurs activités. - PowerPoint PPT Presentation

Transcript of Enseigner la terminologie

Enseigner la terminologie

pour quoi faire ?

1- Enseigner à qui?

Des spécialistes du traitement de la chaîne documentaire :

• traducteurs,

• rédacteurs,

qui ne sont pas en principe des spécialistes des domaines dans lesquelles vont s’exercer leurs activités.

• Quel est l’état du métier et quels outils informatiques sont actuellement disponibles ?

• Quelles sont les évolutions possibles du métier, quels nouveaux métiers sont en germe ?

• Donc quelles compétences souhaitons nous développer ?

2-. Une terminologie : pour en faire quoi et avec quels outils.

La pratique de la terminologie est liée

aux applications auxquelles on la destine (traduction, thesaurus…)

et aux outils dont elle dispose pour gérer la description de la langue et pour diffuser ses données

Une terminologie ad hoc

• « Dans tous les cas, le but du dictionnaire, c’est d’être utile »  Monique Slodzian

Le but n’est pas la description et l’analyse des phénomènes de langue dans les langues de spécialité

• Il faut se poser les problèmes d’application et de gestion en termes

• de résultats

• et de gestion du temps et des coûts.

•d’efficacité ,

• Qui va utiliser cette terminologie ?

3- Une terminologie : pour qui ?

Une entreprise qui croit qu’un glossaire va résoudre ses problèmes de communications entre les différentes filiales ou les conflits hiérarchiques ?

• Une entreprise qui s’est rendu compte que ses ressources documentaires étaient inexistantes et qu’elle avait un besoin d’outils de formation ou d’information d’intervenants ponctuels et de consultants ?

• Une entreprise ayant entrepris une structuration sémantique de ses documents concernant la fabrication ou la maintenance dans des domaines « sensibles » (nucléaire, aéronautique, pharmacie…)?

• Une entreprise ayant besoin de localiser ses produits (logiciels…), de faire des documents qui seront ensuite traduits automatiquement ou par des équipes de traducteurs dont on peut espérer qu’ils respecteront la cohérence terminologique.

• Ou bien le traducteur free lance veut se constituer une mémoire de la terminologie qu’il utilise régulièrement et la coupler avec son outil de traduction assistée (ou éventuellement automatique) de stockage et d’alignement des traductions ?

Tous ces utilisateurs ont des besoins spécifiques qui justifient la création d’un dictionnaire spécialement adapté à leurs besoins.

Donc il faut savoir évaluer

- les besoins (explicites et implicites)

- les coûts en temps, en matériel, les investissements à court terme, les coûts cachés,

- la rentabilité : les économies à long terme.

3- Comment faire ?

FAIRE une terminologie, c’est s’approprier un domaine

mais aussi c’est représenter de manière explicite des connaissances plus ou moins implicites, plus ou moins partagées.

donc

•se donner un outil de représentation d’un domaine de connaissances

•et établir une carte des concepts du domaine et des relations multiples entre ces concepts.

L’exigence de cohérence dans la description des concepts et de leurs relations oblige à une appropriation du domaine

qui suppose la consultation d’ouvrages de vulgarisation,

puis d’ouvrages spécialisés

et le dialogue avec des experts du domaine.

Cette représentation du domaine va nécessairement faire apparaître les différences de structuration notionnelle entre les experts. S’étonner ou regretter ces différences de catégorisations des concepts serait tomber dans le piège de l’objectivisme et croire que le concept flotte au dessus du langage, indépendamment des langues, indépendamment des locuteurs et des situations d’énonciation.

Par le biais de la construction du sens des termes à partir des textes, on va faire apparaître sur le terrain que l’utopie terminologique de l’objectivisme, de l’existence du concept hors langue est une utopie impossible.

pour cela, il faut savoir :

• 1-chercher la documentation, la trier, l’organiser, pouvoir faire une typologie des textes et évaluer la fiabilité des sources (forme/fond),

2- chercher les experts, les contacter, les interroger (et comment),

avec quelles stratégies pour obtenir les résultats escomptés

en profiter pour diffuser une information sur la spécificité du travail du traducteur ou du rédacteur, ses compétences de linguiste, sa capacité à synthétiser l’information, sa capacité à faire affiner la formulation par l’expert

et donc sensibiliser les experts aux incohérences, imprécisions, différences d’approches et de point de vue et les sensibiliser à la polysémie des termes .

L’expert, le spécialiste, est partagé entre des attitudes contradictoires

• Condescendance et méfiance • Intérêt•Méconnaissance du métier de traducteur et des « risques du métier »•Sentiment d’insécurité linguistique•Inquiétude devant le jargon terminologique

•Il apprécie d’exposer ses connaissances en essayant de les organiser•S’il rencontre un autre expert, s’il relit ses remarques, la situation peut devenir passionnante et donner lieu à des échanges et des confrontations de théories ou d’expériences, … ou bien se transformer en guerre des chefs.

Donc il faut l’aborder avec douceur, respect pour son savoir

• et savoir se faire respecter en tant que spécialiste langagier en donnant des preuves de ce qu’on avance et de l’utilité des questions qu’on pose.

•Il faut savoir aussi faire parler l’expert,

lui faire produire de la langue, l’écouter parler, noter ce qu’il dit spontanément en situation, lorsqu’il n’a pas l’impression qu’on lui demande ce qu’il FAUT dire mais seulement comment ça marche.

Exemple N…

Interaction université entreprise

Résumons nous :

formation à la recherche documentaire (papier, électronique, Web).

conduite d’entretien non directif

analyse de la demande et de la situation des acteurs dans l’entreprise

maîtrise des deux langues de travail et de la traduction technique

maîtrise d’outils qui ne sont pas a priori les outils du traducteur :

Powerpoint, Access, Dreamweaver, VBA, php, phpMyAdmin, linux, expressions régulières Perl…

4- La terminologie était dans le texte et regardait le traducteur.

• Avoir accès aux textes, cela veut dire voir comment cette modélisation des concepts du domaine se réalise dans la langue, pas a priori mais « pour de vrai », telle qu’elle est mise en œuvre dans le discours.

• Un langagier travaille sur la production de discours et analyse les textes.

• L’évolution de l’outil informatique fait que l’on a de plus en plus accès à des textes numérisés.

Comment procéder?

• 1-Analyser la source :Savoir qui parle, pour qui et pour quoi faire, toute la dimension pragmatique des textes qui nous renvoie à des besoins de description des sources dont nous avons déjà parlé.

• 2-Stocker : se constituer de grosses bases de ressources de corpus (monolingues, multilingues selon l’objet du travail, comparables ou alignés).

• Analyser le texte de ces corpus avec des outils plus ou moins performants existant sur le marché…

•savoir choisir les outils en fonction des besoins,

•les améliorer ( ?),

•les fabriquer ( ?).

• Extraire à la volée des candidats – termes.

•Recueillir des fichiers de concordances.

•Travailler sur du texte étiqueté (étiqueté comment, avec quelles incertitudes),

•Travailler avec des expressions régulières (analyser les résultats, développer des stratégies de recherche)…

•Savoir demander à des informaticiens de développer les outils dont on a besoin.

DONC constituer un corpus et l’analyser

Quel type de corpus?

Comparables?

Alignés?

Sur supports électroniques

Étiquetés ou non

Exemples :

White balance, 256 segment…, addon, readme

Où en sommes-nous, lorsque toutes ces procédures sont en place ?

• A ce stade, le domaine a été exploré, le corpus recueilli, les experts contactés

• une base documentaire qui donne accès aux corpus a été créée (reste à savoir où et comment).

•on s’est peut-être aussi rendu compte que , dans certains cas de figure,

la documentation n’existe pas, que les supports sont multiples, dispersés, non disponibles.

Dans la vraie vie, parfois, souvent, (toujours ?) l’information ne circule pas, la communication est erratique, la terminologie incohérente, les experts pas d’accord sans même le savoir.

Mais

Il va falloir rechercher l’information,

convertir des fichiers, convaincre ,

user de diplomatie, être pédagogue sans condescendance ni

dogmatisme…

• C’est pourquoi il nous paraît nécessaire de donner une formation à une utilisation astucieuse et « bricoleuse »  de l’informatique,

•et de la compléter par une formation à la conduite d’entretien, à l’analyse des besoins, à l’écoute.

5-De la théorie à l’outil et… vice versa

• Cette étude des termes tels qu’ils sont, et non tels qu’ils devraient être, se revendique d’une approche terminologique dans la ligne des travaux de Jennifer Pearson , de Rita Temmerman.

• Cette approche va orienter des choix de représentation des termes et donc avoir une influence directe sur la structure des bases de données.

•L’usage qu’on se propose de faire du dictionnaire va également influencer le choix de l’outil informatique , la structure de la description.

Nous avons maintenant les matériaux, il faut maintenant constituer la base terminologique proprement dite.

Construire la base,

définir sa structure

Première possibilité

• on apprend à utiliser Trados couplé avec Multiterm (ou SDLX, ou DéjàVu, ou autre avatar des outils d’aide à la traduction).

• Pour un traducteur, il est évident qu’il faut absolument qu’il sache utiliser n’importe quel outil de cette gamme.

mais

(Mais la mémoire de traduction , c’est bien s’il y a une mémoire. C’est à dire si déjà de nombreux textes en langue source ont été alignés avec des textes en langue cible, révisés , fiables. Au début de la mémoire était le premier texte à traduire. Et pour le traduire, il fallait bien passer par toutes les étapes précédentes.)

mais encore

L’outil de mémoire de traduction a ses avantages incontestables et incontournables désormais dans certains domaines et dans certaines conditions de travail

Il a aussi ses limites et ses aspects pervers qu’il faut savoir repérer , analyser et contourner.

nous avons à notre disposition des outils dédiés à la gestion de la terminologie, des outils qui permettent de stocker des termes, de les décrire (bien ou mal) , et de travailler en même temps dans le texte de la traduction en y insérant la terminologie ou en prélevant des termes pour les stocker dans le dictionnaire.

Résumons nous

Il n’est pas question de faire l’impasse sur ces outils. Ils sont d’autant plus importants qu’ils permettent de stocker ce qui est aussi important que la terminologie dans une activité d’écriture dans une langue de spécialité , c’est à dire

la phraséologie, la capacité rhétorique, argumentative de la langue.

Deuxième possibilité

• Deux types de raisons nous ont amenés à choisir aussi d’autres outils pour faire de la terminologie

raisons pédagogiques

• ces outils dédiés au stockage de la terminologie couplé à la mémoire de traduction ne sont pas « exigeants »  sur la structure : on peut y mettre tout et n’importe quoi, à la volée, au feeling. Ils risquent d’éluder une réflexion sur la structure.

raisons pratiques

• Première raison:      ces outils dédiés ne sont pas toujours disponibles, ils coûtent cher , changent souvent, les utilisateurs ne maîtrisent pas leurs principes de fonctionnement et ont du mal à les faire communiquer avec d’autres systèmes ( comment récupérer des données stockées sous Multiterm dans une base Oracle, comment réinjecter des données venues de Word…).

donc

• Il faut savoir bricoler selon les besoins des petits outils avec les ressources bureautiques disponibles partoutmais aussi savoir récupérer ces données pour les reverser dans les outils dédiés, donc comprendre comment ils fonctionnent, les principes de leur structuration.

Deuxième raison pratique

    l’apprentissage des bases de données relationnelles et de la représentation et structuration des données dans des tables oblige à se poser des questions de fond :

•quels tris,

•Qu’est-ce que je veux obtenir de ces données,

•quelles extractions , •pour quoi faire,

•pour qui?

•Cet apprentissage de la modélisation , même simple , est une introduction à la structuration des connaissances, à l’explicitation des relations

Troisième raison pratique

• c’est aussi une introduction aux langages de structuration sémantique de l’information. Quand on a compris comment fonctionne une base de données relationnelle, on comprend vite l’intérêt du balisage XML, de la rédaction structurée, du single sourcing. C’est toute la problématique de la relation entre le sens et la structure qui est posée.

Le choix pédagogique est donc :

• Faire sa base de données soi-même pour apprendre à structurer l’information et justifier ses choix.

Cette décision pose un gros problème : elle est en contradiction avec la nécessité de parvenir à des formats d’échange de terminologie.

Il faut choisir entre deux approches

• imposer une structure normée et ainsi communiquer et fusionner les ressources avec d’autres terminologues/institutions et donc montrer aux apprentis terminologues que la terminologie est un travail de groupe et d’échange (ce qui est formateur)

Ou bien

• enseigner la manipulation des bases de données couplée pas à pas avec l’enseignement de la terminologie pour amener l’étudiant à faire des choix, prendre des décisions, faire des compromis qu’il devra défendre, prévoir comment il va gérer la synonymie, la polysémie, aligner les collocations, faire de son dictionnaire un vrai outil intelligent.

 Nous avons essayé de concilier

les deux démarches. • En faisant construire une base de données

(sous ACCESS ou sous MySQL ou autre) par chaque étudiant puis

•en leur demandant à tous de « verser une extraction de leurs données » dans un moule commun répondant aux exigences des formats d’échange

• Pour cela nous avons élaboré une formation partiellement à distance, sur le Web, avec suivi individuel de projet, où les choix à faire sont à chaque fois l’objet de discussions , de justifications.

• Quelques exemples de ces pages : http://www.ens.eila.jussieu.fr/~juilliard

Notre but• préparer nos étudiants à être autre chose que des

exécutants liés à un outil dont le but est d’accélérer leur production pour accroître leur rentabilité.

Nous souhaitons qu’ils puissent évoluer dans leur vie professionnelle, suivre les mutations des nouveaux marchés liés au développement de la société de l’information, se présenter comme des experts de traitement de la chaîne documentaire, des consultants, des interlocuteurs respectés.

écran1

• Le but de l’écran d’accueil est de montrer les liens entre les différents cours qui convergent tous vers un même but , comprendre, analyser les textes pour pouvoir écrire et traduire avec précision et naturel.

écran 2

écran 3

• Le cours de terminologie est couplé avec l’outil informatique : l’outil base de données va évoluer en répondant aux besoins que l’on va formuler au fur et à mesure de la progression du cours

écran 4

écran 5

L’outil va obliger à répondre à un certain nombre de questions de fond 

• : faut-il, prévoir de mettre plusieurs hyperonymes ?

si oui cela veut dire que les catégorisations peuvent être plurielles 

Ou bien• Les synonymes sont-ils des termes comme les autres ,

•faut-il les mettre dans une table à part ou faut il les ranger dans la table terme ;

•et alors faut-il décider quel est le terme vedette ? (dans quelles conditions , pour quoi faire…).

La réponse à la question

  « ça dépend ».

Ou bien

• Les liens indirects entre les termes sont-ils plus éclairants que les relations logiques ou ontologiques

•et dans ce cas comment faut-il les représenter, comment veut-on les exploiter ultérieurement ?

écran 6

Ou encore

• Les fichiers de concordance que nous avons extraits de corpus vont nous servir à faire les collocations, l’environnement privilégié du terme, qui va nous fournir la phraséologie du domaine et nous permettre de fabriquer un vrai outil de rédaction et de traduction.

• swarm

Quelle structure de tables pour les collocations

Comment faut-il les ranger, selon quels critères ?

S’il y en a beaucoup, le champ risque de devenir illisible,

comment range-t-on les exemples dans un dictionnaire unilingue ?

et dans un dictionnaire bilingue ?

qu’est-ce qui va faciliter la lecture du futur utilisateur de ce dictionnaire ?

Ce ne sont que quelques exemples. Il y en a bien d’autres.

Le principe est que chaque champ est l’occasion d’une réflexion sur toutes les

questions que nous avons évoquées.

Reprenons quelques questions que nous avons posées

• et voyons l’impact sur la structureLa première décision que nous avions prise était de constituer une base de ressources documentaire

Si cette base doit être partagée

Si elle doit servir à constituer une banque de corpus

Et à consulter cette banque

alors

• On pourrait imaginer une structure de base ainsi

• Voir cours1termino

num_source

Langue

intitulé_source (titre /périodique/URL

auteur (nom, mail)

éditeur_lieu_date

Type_public: "spécialistes";"didactique";"vulgarisation";"oral"

complément (complément d'information sur le type de source)

destination : "corpus"," outils"

type_source "essai"," publication recherche", " manuel", "siteWeb" ;"thèse"....

date_inter "Date d'interogation site Web

Domaine

Sous-domaine

micro domaine (titre mémoire termino)

type de travail/niveau (DESS/maîtrise...)..

infos stockage (pour le gestionnaire de la base)

date d'intégration (pour le gestionnaire de la base)

commentaire (pour le gestionnaire de la base)

structure de la base de terminologie

• Maintenant que nous avons créé une base dans laquelle nous avons fait une table des sources des corpus

nous allons construire, dans la même base, des tables nous permettant de stocker la terminologie en fonction de besoins précis, définis à l’avance.

Une table pour tous les termes?Ou une table par langue??

• Une table pour tous les termes

Alors une table de langues?

•une table par langue

Peu importe, ce qu’il faudra, c’est mettre en correspondance les termes d’une langue avec les termes de l’autre (des autres)

Sachant que la relation est de Un à plusieurs et vice versa

français espagnol

Terme 1

Terme 2

Terme 3

Terme 1

Terme 2

Terme 54

Terme 143

Terme …..

Terme 345

• Si nous voulons une relation croisée entre les deux tables

De un à n

Et de n à un

• Alors il faut construire une table intermédiaire qui va gérer les relations:

• À partir du moment où ce qui nous intéresse, c’est le terme dans son environnement linguistique immédiat, où nous ne voulons pas simplement traduire des termes mais traduire un discours, il nous faut bien adapter l’outil à nos besoins. Inversement c’est la puissance de l’outil qui nous mène à lui demander, et à nous demander, davantage.

Ce ne sont que quelques exemples. Il y en a bien d’autres.

Le principe est que chaque champ est l’occasion d’une réflexion sur toutes les questions que nous avons évoquées.

(mettre avant?) Table des termes

• Nous avons trouvé des termes (ou candidats termes) dans les corpus récoltés

Nous en sommes au stade de l’appropriation du domaine: nous ne savons pas encore quels sont les termes pertinents ni quelles sont leurs définitions et leurs relations entre eux.

Nous voulons les stocker

Comment appréhender le concept?• Qu’est-ce que la définition?• Est-il important de faire des définitions

canoniques?• La collecte de corpus va-t’elle nous permettre de

confirmer ou au contraire de modifier la définition? (dégager la polysémie, une évolution du concept , des différences de point de vue).

• La définition canonique part de l’hyperonyme: est-ce pertinent?

• Peut-on définir les CNS? Quel recensement des cohyponymes cela suppose-t’il?

Les relations entre termes

• Un terme ne se définit que par relation avec les autres termes du domaine :

• Relations hiérarchiques

• Relations d’équivalence

comment poser les problèmes de synonymie?

Un synonyme est-il un terme à part entière?

• Equivalences de langue à langue