Analyse exploratoire d¢â‚¬â„¢un corpus...

download Analyse exploratoire d¢â‚¬â„¢un corpus d¢â‚¬â„¢apprentissage collaboratif: 2011-01-28¢  of discussions between

of 12

  • date post

    02-Aug-2020
  • Category

    Documents

  • view

    0
  • download

    0

Embed Size (px)

Transcript of Analyse exploratoire d¢â‚¬â„¢un corpus...

  • JADT 2010 : 10 th International Conference on Statistical Analysis of Textual Data

    Analyse exploratoire d’un corpus d’apprentissage collaboratif: détection de reformulations multimodales

    lors des échanges enseignant-étudiant

    Amélie Ngatsi-Imafouo

    Ecole Nationale Supérieure des Mines de Saint-Etienne 158 Cours Fauriel - 42023 Saint-Etienne cedex2 – France

    Résumé Les traces obtenues suite à une interaction avec un environnement informatique (d’apprentissage, de travail, de collaboration) sont (doivent être) porteuses d’indications sur l’activité réalisée au sein de cet environnement. Dans le cadre de l’apprentissage collaboratif assistée par ordinateur, il s’agit pour les chercheurs d’exploiter les traces pour la compréhension du parcours cognitif des apprenants, au cours de l’activité collaborative d’apprentissage. C’est dans ce cadre que se situe notre étude. A travers l’outil Lexico3, nous nous intéressons particulièrement aux reformulations lors des échanges enseignant/étudiant, notamment la façon dont les étudiants prennent note à propos des concepts importants énoncés par l’encadrant de projet.

    Abstract The traces obtained after an interaction with an IT environment (for learning, work or collaboration) should give information about the activity realized through this environment. In Computer Supported Collaborative Learning (CSCL), researchers need to make use of these traces to analyze and understand the learning situation. The work presented here is within this frame. The Lexico3 tool helps us to detect reformulations in a corpus made of discussions between a teacher and a couple of students about tutoring computer programming projects. For example, we analyze the link between the students’ note-taking and the teacher’s speech.

    Keywords: reformulation, interaction traces, collaborative learning, trace analysis

    1. Introduction Les interactions médiatisées par ordinateur laissent de traces qui sont/doivent être porteuses d’indices sur le déroulement de l’activité dont elles sont issues. Pour les chercheurs qui utilisent ces traces afin de comprendre le processus (cognitif) qui a eu lieu au cours de l’activité ou pour des concepteurs d’environnement qui souhaitent comprendre comment les utilisateurs se sont appropriés leur environnement, il est primordial de fournir des outils pour rendre aisé l’accès au contenu des traces d’interaction.

    Une fois recueillies, ces traces sont plus ou moins mises en forme pour constituer un corpus. Ce dernier sert de base de travail aux chercheurs en sciences cognitives qui l’utilisent pour décrypter/détecter des évènements intéressants dans le déroulement de l’activité. Dans le cadre de l’apprentissage collaboratif assistée par ordinateur (Computer Supported Collaborative Learning ou CSCL), il s’agit pour les chercheurs d’exploiter les traces pour la compréhension du parcours cognitif des apprenants. C’est dans ce cadre que se situe notre étude. Nous analysons un

    www.ledonline.it/ledonline/jadt-2010.html

  • 964 ANALYSE EXPLORATOIRE D’UN CORPUS D’APPRENTISSAGE COLLABORATIF

    JADT 2010: 10 th International Conference on Statistical Analysis of Textual Data

    corpus de traces recueillis lors de séances de présentation des projets informatique aux étudiants d’une école d’ingénieur à travers l’outil Tatiana (Trace Analysis Tool for Interaction Analysts). C’est un outil d’analyse de traces permettant d’analyser les interactions issues d’outils collaboratifs. Il permet entre autres la collecte, la synchronisation, la visualisation, et l’analyse des corpus d’interactions médiatisées (Dyke et al., 2009a ; 2009b). Nous nous intéressons particulièrement aux reformulations lors des échanges enseignant/étudiant, notamment la façon dont les étudiants prennent note à propos des concepts importants énoncés par l’encadrant de projet.

    Tout d’abord, nous présentons quelques cas d’analyse exploratoire de corpus écrits (ou oraux transcrits) dans des domaines divers et variés. Plusieurs logiciels libres ou commerciaux offrent des fonctionnalités riches d’analyse textuelle (statistique textuelle, lexicométrie, etc.) et soutiennent ces études. Le cadre de notre étude est ensuite présenté plus en détails ainsi que les analyses que nous avons effectuées. Nous terminons par les perspectives de ce travail.

    2. Analyse exploratoire de corpus dans divers domaines Un certain nombre de travaux se sont penchés sur l’analyse exploratoire de données. Ces travaux se situent dans des domaines divers. Bon nombre s’appuient sur des corpus constitués de transcriptions d’entretiens. Ainsi, (Gelinas-Chebat et al., 2004) analysent des transcriptions d’entrevues avec des jeunes sur le thème du tabagisme, afin d’évaluer l’impact des messages dissuasifs et brochures de lutte de contre le tabagisme sur ces jeunes. Le logiciel SATO est utilisé dans une démarche itérative de construction de catégories lexicales sur ces données. D’autres travaux portant sur ce même corpus d’entrevues ont combiné divers logiciels (Alceste, DTM, Lexico3) pour valider et compléter l’analyse précédente (Daoust et al., 2006). (Peyrat- Guillard, 2006) s’appuient de façon complémentaire sur les logiciels Alceste et WordMapper pour analyser un corpus d’entretiens dont le but est d’étudier les diverses formes d’implication au travail. Ces outils permettent de générer des classes de discours, caractérisées par un certain vocabulaire spécifique. Pour ces auteurs, l’outil Alceste donne une meilleure vue d’ensemble du corpus, tandis que WordMapper met en évidence l’articulation des divers thèmes entre eux. Pour étudier l’interaction entre intervieweur et interviewés dans des entretiens semi-directifs, Bonneau (2008) utilise les logiciels Alceste et Lexico et obtient une « cartographie d’indices linguistiques, thématiques et énonciatifs» qui facilite l’analyse d’entretiens semi-directifs. Le logiciel DTM a été utilisé par Cailliau et Poudat (2008) pour l’observation des caractéristiques lexicales dans les dialogues (téléphoniques retranscrits) entre agents EDF Pro et des clients. Le corpus qui comprend plus de 1000 conversations téléphoniques retranscrites est filtré (étiquetage morpho-syntaxique et désambiguïsation, lemmatisation) et les oppositions significatives entre les discours des deux catégories d’acteurs sont alors analysées.

    Certaines analyses exploratoires se sont appuyées sur des corpus purement textuels. (Diard and Trebucq) se sont intéressés à l’analyse exploratoire des normes internationales d’audit interne. Grâce au logiciels Alceste et Tropes, les auteurs identifient les principales thématiques abordées dans ces normes et déduisent que le réseau des relations entre acteurs de l’audit interne est incomplet. Ils ont ainsi pu recommander une meilleure structuration des textes des normes internationales. D’autres travaux comme ceux de Bonin et Dallo (2003) ont utilisé les logiciels Lexico3 et Hyperbase pour réaliser une étude lexicométrique sur des textes et présentent une étude comparative des fonctionnalités des deux outils pour conclure en leur complémentarité. L’article de Salem et Fleury (2008) donne un ensemble d’analyses exploratoires réalisées grâce au logiciel Lexico : ces analyses portent sur divers domaines et traitent par exemple de la comparaison de corpus (la comparaison de textes produits par des groupes islamistes de

  • AMÉLIE NGATSI-IMAFOUO 965

    JADT 2010: 10 th International Conference on Statistical Analysis of Textual Data

    tendance djihadite pour mettre en lumière l’évolution de leur vocabulaire qui traduit l’évolution de l’idéologie et de leurs buts affichés) ou encore de l’analyse de discours (analyse des discours du roi d’Espagne aux forces armées).

    Clérot et al. (2004) proposent quant à eux le modèle « monomaniaque », un modèle statistique dans le cadre de l’analyse exploratoire de corpus textuels. Chaque document du corpus est découpé en paragraphes auxquels seront associé un thème unique. La combinaison des thèmes des paragraphes d’un document déterminera un/des thème(s) du document.

    Comme nous pouvons le constater, dans le cadre de l’analyse de textes assistée par ordinateur, divers outils et logiciels ont vu le jour. Pour permettre de développer des chaines de traitements en utilisant plusieurs de ces outils, un format XML-TEI (Text Encoding Initiative) pour échanger les corpus annotés a été proposé (Daoust and Marcoux, 2006).

    Notre travail a la particularité de s’appuyer sur un corpus contenant à la fois des données issus de transcriptions d’échanges oraux mais aussi du texte.

    3. Traces d’interaction dans le domaine CSCL

    3.1. Définition de traces

    Une trace est « une marque d’une action quelconque, d’un événement ou d’une situation passée ». Elle peut aussi être comprise comme « une quantité infime de quelque chose ». (Settouti et al., 2006) parlent de systèmes à base de traces modélisées pour les Environnements informatiques pour l’Apprentissage Humain (EIAH). Les auteurs s’intéressent à la notion de trace numérique qu’ils définissent comme la trace de l’activité d’un utilisateur qui utilise un outil informatique pour mener à bien cette activité, s’inscrivant sur un support numérique: « la trace est alors une empreinte restante relatant l’historique et la chronologie de l’interaction de l’apprenant ».

    Choquet et Iksal