Corpus d’apprenants et vocabulaire académique
de l’anglais
Sylviane Granger & Magali PaquotSylviane Granger & Magali PaquotCentre for English Corpus Linguistics
Université catholique de Louvain
Plan
� Introduction� Corpus d’apprenants� Méthodes d’analyse
� Textes argumentatifs en anglais L2
2
Textes argumentatifs en anglais L2� Caractéristiques générales de l’interlangue� Utilisation du vocabulaire académique
�Extraction d’une nouvelle liste�Analyse contrastive L1 – L2
� Applications pédagogiques� Conclusion
Corpus
� Ensemble de données langagières authentiques (écrites ou orales)
� Support électronique
4
� Support électronique� Critères de sélection explicites� Encodage standardisé et homogène
Corpus de langue maternelle et apprentissage des langues
� Avantages: description très précise desvariétés de langue; possibilité de distinguerles phénomènes linguistiques fréquents desphénomènes plus rares; remise en question
5
phénomènes plus rares; remise en questiondes descriptions/règles traditionnelles
� Lacunes: aucun renseignement sur le degré dedifficulté d’apprentissage des phénomèneslinguistiques (cf. Widdowson 1991: « frequencyprofiles do not of themselves carry anyguarantee of pedagogic relevance »
Corpus d’apprenants
� Ensemble de données langagières authentiques (écrites ou orales) sur support électronique
� Emanant d’apprenants de langue étrangère
6
� Emanant d’apprenants de langue étrangère ou seconde
� Critères de sélection explicites (hétérogénéité de l’interlangue)
Authenticité
“In a foreign language environment, what comes closest to naturally occurring texts in the strict sense are texts that are produced for pedagogical reasons and texts that are elicited for the corpus but that use procedures exerting very little control.” (Ellis & Barkhuizen 2005: 23)
7
� Productions libres ⇒ ‘clinical data’clinical data’ ⇒ données expérimentales
� “the use of tasks where learners are primarily concerned with message conveyance, need to utilize their own linguistic resources to construct utterances, and are focused on achieving some non-linguistic outcome” (ibid)
Données textuelles
� Discours continu (vs. phrases décontextualisées)� Permet d’étudier le lexique, la phraséologie, la syntaxe, le
discours, les registres et genres� Donne une meilleure idée des variétés avancées de L2
8
Donne une meilleure idée des variétés avancées de L2 dont les traits principaux “are not the –ing endings and third person-s we are familiar with, but involve more the areas of lexical expansion, genre diversification, and others yet to be identified” (Cobb 2003: 419)
� Constitue une base très riche pour l’étude du transfert de la L1
Critères de sélection
� En rapport avec l’apprenant : âge, langue maternelle, niveau, etc.
9
� En rapport avec l’activité : mode (oral/écrit), type de tâche, temps imparti, etc.
International Corpus of Learner English (ICLE) (Granger et al 2002)
� Apprenants d’anglais langue étrangère� Niveau intermédiaire à avancé (B2-C2)� Ecrits argumentatifs (+/- 700 mots par texte)
10
� Ecrits argumentatifs (+/- 700 mots par texte)� Plusieurs langues maternelles� Critères de sélection stricts
ICLE: variables
Learner variables Task variables
� Age� Learning context
Proficiency level
� Medium� Field
Genre
11
� Proficiency level� Gender� Mother tongue� Region� Other FL� L2 exposure
� Genre� Length� Topic� Task setting
� Timing� Exam� Reference tools
ICLE CD-ROM v2 (Granger et al 2009)
� 3.7 millions de mots� 16 langues maternelles
� allemand, bulgare, chinois, espagnol, finnois, français, italien, japonais, néerlandais, norvégien, polonais, russe,
12
italien, japonais, néerlandais, norvégien, polonais, russe, suédois, tchèque, tswana, turc
� Interface de recherche conviviale� Concordancier
�Etiquetage morphosyntaxique (CLAWS 7)�Requêtes simples et plus sophistiquées �Statistiques liées aux profils
L1 vs L2: implications pédagogiques
L1 L2
Overuse / Underuse / Misuse
16
Learner needsTeaching objectives
Teachability
SELECT IGNORE
Analyse comparative L2 vs L2
� Comparaison d’étudiants de même niveau mais de langues maternelles différentes ⇒caractéristiques propres aux différents niveaux d’interlangue (cf. Bartning 1997: niveau
19
d’interlangue (cf. Bartning 1997: niveau avancé)
� Distinction entre caractéristiques communes aux apprenants de langues maternelles différentes et celles qui sont propres à un groupe national donné (transfert)
Connecteurs� Mésusage: erreurs sémantiques, syntaxiques, stylistiques
� Raskolnikov differs from Onasis, of course. Onasis had everything. Raskolnikov, *on the contrary [by contrast ] had nothing. (ICLE-RU)
� Suremploi � Many people think that this is a waste of time …. So they want to
get rid of the military service (ICLE-DU).
21
get rid of the military service (ICLE-DU).� Spanish holds an important position in South America and
increasingly so in the United States, too . According to Crystal, it has little further potential outside Spain, though . (ICLE-FI)
� Sous-emploi� Connecteurs résultatifs (hence, therefore, thus) et contrastifs
(however, yet) (Altenberg & Tapper 1998 – apprenants suédois)� < > Milton (1999): apprenants de Hong Kong: suremploi de
therefore
Les verbes à haute fréquence
� Nesselhauf (2003, 2005)Collocations ‘verbe + objet’, apprenants allemands� Choix erroné du verbe
� *carry out races (enter, run)
22
� *carry out races (enter, run)
� Noms qui posent problèmes: action, aim, attitude, problem, question, statement, step, conclusion
� 56% des collocations erronées = potentiellement dues au transfert
Séquences récurrentes (De Cock 2003, 2004)
� Apprenants francophones� Sur-emploi
� that is to say, in order to, and so, in fact� I think, we can say that
23
I think, we can say that� as far as I am concerned� *according to me
� Sous-emploi de séquences récurrentes typiques du language scientifique� the issue of, a strong argument, opponents of, the effects
of, states that
Projet ARC: Apprentissage des langues étrangères : niveaux phraséologiques et discursifs (2003-2008)
� Objectifs: � théorique: étudier
� l’influence des facteurs développementaux et interlinguaux sur le processus d’apprentissage des langues étrangères
� deux domaines: phraséologie et discoursà des niveaux plus avancés d’apprentissage
24
� à des niveaux plus avancés d’apprentissage� méthodologique:
� démontrer l’importance d’une approche basée sur les corpus d’apprenants
� appliqué: � renforcer le lien entre théorie et pratique en
apprentissage des langues étrangères� Trois langues: anglais, français et néerlandais� Bolly, Klein & Lamiroy (2005); Granger & Meunier
(2008); Meunier & Granger (2008)
Utilisation du vocabulaire académique en anglais L1 et L2(Paquot 2007)� Corpus:
� Corpus académique en anglais L1 (sous-corpus du BNC –15 millions de mots)
� Divers sous-corpus d’ICLE (c. 1.2 millions de mots)
Objectifs:
25
� Objectifs:� Mettre en évidence les caractéristiques communes à
l’interlangue� Evaluer l’influence de la langue maternelle sur l’utilisation
du vocabulaire académique par les apprenants francophones
Lexique scientifique transdisciplinaire
� “Ce lexique [lexique scientifique transdisciplinaire],essentiel à l’expression de la pensée scientifique, côtoie la terminologie dans le discours. On considère que le LST transcende les domaines de spécialité et présente un noyau lexical commun significatif entre les disciplines . Le lexique
26
significatif entre les disciplines . Le lexique scientifique transdisciplinaire n’est pas saillant dans les textes scientifiques dans la mesure où, contrairement à la terminologie, il se rencontre également dans la langue commune . Par contre, il est au coeur même de l’argumentation et de la structuration du discours et de la pensée scientifique.” (Drouin 2007:45)
Exemples
� advocate, argument, by contrast, conclude, for example, investigate, issue, method, research, theory
>< Langue générale
27
>< Langue générale� the, of, be, time, work, people, house
>< Terminologie� Linguistique: morpheme, hapax legomena,
lemma, type, token, sense, reference
Quel vocabulaire académique?
� Coxhead’s (2000) Academic Word List (AWL)� 570 familles de mots� Ne faisant pas partie des 2.000 mots les plus
fréquents
28
fréquents�General Service List (GSL) (West 1953)
� Objectif: décodage�GSL + AWL + terminologie � 95% de mots compris à
la lecture = seuil critique pour la compréhension de textes (Nation 2001:197)
Une nouvelle liste académique
� The Academic Keyword List� 3 corpus d’1 million de mots
� Sciences humaines et sociales (articles et livres)� Sciences exactes (articles et livres)
29
� Textes d’étudiants britanniques
� Chaque corpus comprend 5 sous-corpus� Disciplines
� Etiquetage morphosyntaxique
3 critères pour identifier des mots qui ….
… sont significativement plus fréquents dans des textes académiques que dans des textes non-académiques
Keyness
31
… sont distribués de manière égale à travers les différents corpus
Evenness of distribution
… apparaissent dans une large proportion des textes étudiés
Range
non-académiques
Fréquence de law vs. example
400500600700800900
LAWEXAMPLE
32
0100200300400
MC A
RTS M
C BEL
MC S
OC BNC H
UM
BNC PO
L BNC S
OC
MC S
C
MC A
PPSCBNC S
CBNC T
ECH
BAWE A
RTS
BAWE H
ISTORY
BAWE P
SYCHO
BAWE S
OC
LOCNESS
EXAMPLE
Un 4e critère: catégories sémantiques
5.6%
12%
44%
argue, claim, define,
amount, extent; high, large; increase
activity, circumstance; perform, cause; similarly
L: Language and
N: Numbers and measurement
A: General and abstract terms
338%
9%
7.7%
5.6%
whether, according to, moreover, thus
assumption, interpretation
facilitate, impose
argue, claim, define, suggest
Z: Names and grammar
X: Psychological actions, states and processes
S: Social actions, states and processes
L: Language and communication
Academic Keyword List
� 930 mots� however, as, therefore, such as , system, for
example , problem, development, case, provide, effect, between, use (v.), result, thus, group, example,process, argue, use (n.), value, different,
34
example,process, argue, use (n.), value, different, change, role, issue, develop, period, describe, base, structure, number, concept, condition, show, approach, difference, rather than , term, particular, consider, involve, include, significant, define, action, in terms of , evidence, common, type, produce, similar, practice, suggest, increase, relate, represent, basis, consequence
Fonctions rhétoriques � Exemplifier: example, for example, for
instance, illustrate, exemplify, such as, notably, e.g.
� Résumer et conclure: summary, summarize, conclusion, conclude
36
conclusion, conclude
� Comparer et contraster: comparison, difference, contrast, parallel, to compare, to contrast, equally, similarly, conversely, unlike, contrary to, despite, as opposed to, rather than, versus, as well as, however, whereas, although, even though, etc.
Analyse des marqueurs en L1
� Les adverbes ne sont pas les marqueurs de cohésion par défaut dans le discours académique.
� Rôle discursif des noms, verbes, adjectifs et leur phraséologie
37
� Cause and effect� Noms [32.5%] : cause, factor, source, origin, root,
reason, consequence, effect, result, outcome
� Verbes [16%]: cause, bring about, contribute to, induce, lead to, prompt, provoke, result in, yield, derive, emerge, stem
Phraséologie du discours scientifique
� Discours scientifique: phraséologie spécifique� Extensions lexicales des mots académiques
� as discussed below; an example of … is …; the aim of this study ; it has been suggested …
38
aim of this study ; it has been suggested …� Séquences sémantiquement et syntactiquement
compositionnelles
� Pour une définition élargie de la phraséologie (cf. Granger et Paquot 2008a)
Idiom principle
� The principle of idiom is that a language user has available to him or her a large number of semi-preconstructed phrases that constitute single choices, even though they might appear to be analysable into segments. To some extent, this may
39
analysable into segments. To some extent, this may reflect the recurrence of similar situations in human affairs; it may illustrate a natural tendency to economy of effort; or it may be motivated in part by the exigencies of real-time conversation. (Sinclair 1991:110)
Textual phrasemes
� Structurer et organiser le contenu (information référentielle) d’un texte � Linking adverbials : in other words, by the way,
that is to say, as a result, in conclusion
40
that is to say, as a result, in conclusion� Textual sentence stems : the final point is …;
another issue is …; it will be shown that …; I will discuss …; as has been suggested by …
Analyse des marqueurs en L2
� Répertoire lexical limité� Registre inapproprié� Spécificités lexico-grammaticales et
41
Spécificités lexico-grammaticales et phraséologiques
� Erreurs sémantiques
Registre inapproprié
� Suremploi d’items lexicaux typiques de la langue parlée� Le verbe say; l’adverbe though en fin de phrase;
la préposition like
43
� I am going to talk about; by the way; of course
� Sous-emploi des mots et phrasèmes typiques du discours académique � adverbe notably; verbes illustrate et exemplify� extensions lexicales: … is discussed in; as
suggested by….
Transfert
� Pas seulement sémantique� Autres types de transfert:
� phraséologique (collocations; séquences
44
récurrentes)� stylistique� fonctionnel/rhétorique � quantitatif
Suremploi de Let us / Let’s …dans ICLE-FRENCH
� To illustrate the truth of this, let us take the example of Britain ...
� Let us then focus on the new Europe as a giant whose parts are striving for unity.
45
whose parts are striving for unity. � Let us now turn our attention to the students
who want to apply for a job in the private sector. � Let us be clear that we cannot let countries tear
one another to pieces ...
En français …� Citons comme exemple le jugement difficile des autorités
françaises sur les activités du régime de Vichy dans le cadre du procès de Touvier.
� Envisageons tout d’abord la question économique.� Examinons quelques exemples pour tenter d’y voir plus
clair.
46
clair.� Et notons que ces réalisations nous inspirent des rêves
insoupçonnés jusque là, …� Considérons un instant le cinéma actuel.� Pensons , par exemple, à l’Espagne, qui, ….� Ainsi, supposons une personne de sexe féminin, habitant
Arlon, …� Voyons d’abord les effets que provoquerait un monde qui
…
Contribution aux outils pédagogiques
� Tous les outils pédagogiques� Ouvrages de référence
� Grammaires� Dictionnaires
48
� Manuels� Didacticiels (ALAO)
� Apport� Sélection des unités linguistiques� Ordre d’apprentissage� Feedback négatif
Lexicographie pédagogique
� Macmillan English Dictionary for Advanced Learners (2007)
� Collaboration Centre for English Corpus Linguistics – Macmillan Dictionaries
49
Linguistics – Macmillan Dictionaries� Analyse de ICLE pour produire
� Des notes d’erreurs basées sur des erreurs authentiques fréquentes
� Une section d’aide à l’écriture basée sur l’analyse de corpus académiques L1 et L2
Complexity and Fluency� Compenser la pauvreté lexicale
� recours systématique à des mots fréquents, neutres et “sûrs” (safe):� thing à la place de topic, issue, question, point
� Maîtriser les conventions académiques:
51
� Maîtriser les conventions académiques:� registre
� collocations, phraséologie� marqueurs du discours� colligation (position préférentielle dans la phrase,
etc.)
12 sections � Adding information� Comparing & contrasting� Exemplification� Expressing cause and effect� Expressing personal opinions
Expressing possibility and certainty
52
� Expressing possibility and certainty� Introducing a concession� Introducing topics and related ideas� Listing items� Quoting and reporting� Reformulation: paraphrasing and clarifying� Summarizing and drawing conclusions
350 items lexicaux de l’ AKL
� Donner des exemples: example, for example, for instance, illustrate, exemplify, such as, notably, e.g.
� Comparer et contraster: comparison,
53
� Comparer et contraster: comparison, difference, contrast, parallel, to compare, to contrast, equally, similarly, conversely, unlike, contrary to, despite, as opposed to, rather than, versus, as well as, however, whereas, although, even though, etc.
Les difficultés des apprenants
� Fréquence (sur- & sous-emploi)� Registre� Sémantique
56
� Sémantique� Phraséologie� Position syntaxique
Expression d’une opinion personnelle: répertoire lexical
� Manières plus implicites d’exprimer une opinion personnelle:
� structures impersonnelles
58
� it is ADJ + to.. (it is reasonable to assume…)
� it is ADJ + that (it is significant that …)
� it is worth + V-ing (it is worth noting that…)
� adverbes d’évaluation
� Interestingly, … Surprisingly, …
Expression de l’effet: colligation
� ‘The place in a sequence that a word or word sequence prefers (or avoids)’ (Hoey 2005.43)
therefore at the beginning of the sentence
62
0
50
100
150
200
250
300
350
Academic w riting Learner w riting
Fre
q. p
er m
illio
n w
ords
Expression d’une opinion personnelle: ‘Get it Right’ notes et ‘Collocation boxes’
Verbs frequently used in the structure it is worth + V-ing:asking, considering, emphasizing, examining, investigating, looking at, mentioning, noting, pointing out, quoting, recalling, remembering,
CollocationDon’t use the expressions according to me or according to my opinion when you give your opinion.���� According to me, the prison system is not outdated.
Get it right !
63
pointing out, quoting, recalling, remembering, repeating, stressing
outdated.����In my opinion, the prison system is not outdated.���� According to my opinion, women and men are equal.����In my view, women and men are equal.For more information on according to, see the writing section on “Quoting and Reporting”.
Corpus d’apprenants
� Les corpus d’apprenants constituent une fenêtre de premier choix sur l’acquisition des langues étrangères et secondes.
65
� Difficultés particulières liées au discours scientifique
Outils pédagogiques
� Tous les outils pédagogiques peuvent bénéficier des apports de ce type de corpus.
Discours scientifique
66
� Discours scientifique� Besoin d’outils d’aide à l’écriture fiables et
conviviaux� Répondant aux difficultés attestées des
différentes populations� Milieu académique et professionnel
Une première étape
� Macmillan English Dictionary for advanced learners
� Limites des sections au milieu du dictionnaire� Aucune certitude qu’elles sont employées
67
� Aucune certitude qu’elles sont employées� Aucun lien avec les entrées du dictionnaire
(cf. Granger et Paquot 2008b)
Deuxième étape …
� Dictionnaire / Aide à l’écriture électronique� Lexique scientifique transdisciplinaire� Phrases exemples dans une discipline spécifique
68
� Accès à des corpus� Commentaires pour l’apprenant sur des difficultés
attestées
� Interface web conviviale
Top Related