KHALFALLAH HAMMOUDA Faten

37
KHALFALLAH HAMMOUDA Faten Exposé Construction d’un dictionnaire de noms composés en arabes

description

Exposé. Construction d’un dictionnaire de noms composés en arabes. KHALFALLAH HAMMOUDA Faten. plan. 16/09/2014. Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives. 2. Introduction. - PowerPoint PPT Presentation

Transcript of KHALFALLAH HAMMOUDA Faten

Page 1: KHALFALLAH HAMMOUDA Faten

KHALFALLAH HAMMOUDA Faten

Exposé

Construction d’un dictionnaire de noms composés en arabes

Page 2: KHALFALLAH HAMMOUDA Faten

planplanIntroductionEtat de l’artNoms composés arabesTransducteurs NooJDémarche proposéeExpérimentation et évaluation Conclusion et perspectives

21/04/23 2

Page 3: KHALFALLAH HAMMOUDA Faten

Le traitement automatique de la langue naturelle

(TALN) touche plusieurs domaines

Traitement de noms composés:

• Facilite l’analyse syntaxique • Facilite la traduction automatique d’une langue à autre (i,.e, البحر ( épouse de mer عروس• Extraction d’informations

Introduction

Nombreux travaux tiennent compte des problèmes de composition dans les langues naturelles

Noms composés fréquents dans les corpus

Page 4: KHALFALLAH HAMMOUDA Faten

Introduction

Problématiques

• Comment effectuer ce recensement?

• Comment fixer l’approche à utiliser?

• Le nombre variant de composants de noms composés.

• Manque de consensus.

• Variété de langues

Page 5: KHALFALLAH HAMMOUDA Faten

• Recenser l’ensemble de noms composés arabes à partir d’un corpus

• Construire des transducteurs en se basant sur une liste de règles grammaticales et lexicales

•Faire les exploiter sur la plateforme NOOJ

Introduction

Objectifs

Page 6: KHALFALLAH HAMMOUDA Faten

planplanIntroductionEtat de l’artNoms composés arabesTransducteurs NooJDémarche proposéeExpérimentation et évaluation Conclusion et perspectives

21/04/23 6

Page 7: KHALFALLAH HAMMOUDA Faten

Etat de l’artPlusieurs travaux ont été effectués dans le cadre des aspects de la composition nominale

•Bauer(1988), la composition est « la formation d’un

Nouveau lexème par l’adjonction de deux lexèmes

ou plus», mais il ne définit pas clairement le lexème

•Benveniste (1974) donne le critère de référence de la

Composition « il y a composition quand deux termes

identifiables pour le locuteur se conjoignent en une unité

nouvelle à signifiant unique et constant » i,.e. portefeuille

• Bourigault(1994), un terme complexe doit contenir au moins une tête et une expansion. i,.e. الصغيرة الشاشة

Page 8: KHALFALLAH HAMMOUDA Faten

Etat de l’artIl existe 3 approches pour l’extraction

• Approche statistique Nakagawa et Mori (1998)

• Approche linguistique Bourigault (1994), Savary (2000)

• Approche mixte Daille (1994), Smadja (1993)

Page 9: KHALFALLAH HAMMOUDA Faten

planplanIntroductionEtat de l’artNoms composés arabesTransducteurs NooJDémarche proposéeExpérimentation et évaluation Conclusion et perspectives

21/04/23 9

Page 10: KHALFALLAH HAMMOUDA Faten

Un nom composé arabe est une suite de noms qui ne peuvent pas être séparés par un autre mot.[A.Abdelwehed] Exemples: المرمى gardien , حارس

الصغيرة télévision , الشاشة

Noms composés arabes

Page 11: KHALFALLAH HAMMOUDA Faten

Noms composés arabes

Le composé annexe " المركب االضافي "Le composé référentiel " المركب االسنادي "Le composé substitutif " البدلي " المركبLe composé confirmatif " التوكيدي " المركبLe composé simili-référentiel " االســنادي شبه

" المركبLe composé descriptif " المركب النعتي "La filiation " الكــنية "

Typologie

Page 12: KHALFALLAH HAMMOUDA Faten

Typologie

Les noms composés arabes peuvent être:

Noms composés arabes

• Nom propre composé ( , , عبد علي محمد الرحمان عبد(الكريم

• Nom nom nom*( الطفولة نادي رئيس محــكمة، (رئيس

• Nom* nom propre ( شكري المرمى حارس حسين، الملك(الواعر

Page 13: KHALFALLAH HAMMOUDA Faten

Noms composés arabesComposé annexe

إضافي مركب

Annexantمضاف

Annexéإليه مضاف

un annexant

• doit être toujours simple

• ne permet pas l’ajout de l’article الــ ni le duel ‘ المثن8ى ‘

un annexé

• peut être simple ou complexe

• permet l’ajout de l’article الــ et le duel ‘ المثن8ى ‘

I,.e. الخارجّي�ة رئّيسخارجّي�ة رئّيس

Page 14: KHALFALLAH HAMMOUDA Faten

Noms composés arabesComposé référentiel

إسنادي مركب

Attributمسند

Corrélatif de l’attributإليه مسند

• Syntagme nominal (i,.e, الصغيرة ( الشاشة

• Syntagme verbal (i,.e, ا شر8 8ط ( تأّب

•Permet l’ajout ou l’absence du déterminant الــ dans les deux parties du composé ensemble

Page 15: KHALFALLAH HAMMOUDA Faten

Noms composés arabes

substitutifبدل

ـب بدلي Composé substitutifمــرّكـ�

substituéمبدل منه

مفردsimple

مفردsimple

مرّكبcomposé

مرّكبcomposé

إضافيannexe

نعتيdescriptif

Exemples:

األموي الخلّيفةنافع ابن عــقــبة

Page 16: KHALFALLAH HAMMOUDA Faten

Noms composés arabes

simpleمفرد

ـب نعتي composé descriptifمــرّكـ�

composéمرّكب

مرّكب اسميComposé nominal

مرّكب حرفي بالجرComposé

prépositionnel

مرّكب موصولي اسمي

Composé relationnel

nominal

مرّكب اسناديComposé référentiel

نعت + منعوتExemples:

الصغّيرة الشاشةالروح خفّيف

Page 17: KHALFALLAH HAMMOUDA Faten

Noms composés arabesب توّكّيدي Composéمــرّكـ�confirmatif

Agentفاعل

Patient directمفعول به

Primatمبتدأ Prédicatخبر

Descriptifنعت Distinctifتمّيّيز

Page 18: KHALFALLAH HAMMOUDA Faten

Noms composés arabesAmbiguïtés

• Plusieurs cas sémantiques peuvent produire des ambiguïtés

الملعب مفتاح صالح محمد دخل Mohamedsalah a entré au terrain

القفل في البيت مفتاح صالح محمد أدخل Mohamedsalah a entré la clé de la maison dans le canon

المنزل مفتاح صالح محم8د تسلمMohamed salah a pris la clé de la maison

Polysémie

• comportement des verbes

• transitivité

Page 19: KHALFALLAH HAMMOUDA Faten

Synonymie

المصطفى كان نبيال الن�بي� كريما سول كان نبيال الر� كريما

Le prophète était généreux et noble

Solutions?

• Textes voyellés• Dictionnaire de déclencheurs• Construire des règles par des grammaires locales

Noms composés arabes

أخيه حسنسافر مع Hasan a voyagé avec son frère

علي سافر أخيه أبو معAbou Ali a voyagé avec son frère

Page 20: KHALFALLAH HAMMOUDA Faten

planplanIntroductionEtat de l’artNoms composés arabesTransducteurs NooJDémarche proposéeExpérimentation et évaluation Conclusion et perspectives

21/04/23 20

Page 21: KHALFALLAH HAMMOUDA Faten

Transducteurs NooJ

Transducteur

• Dispositif algorithmique qui présente un ensemble de séquences en entrée et associe des séquences produites en sortie

• Permet de modifier les séquences en entrée (effacement, remplacement)

Page 22: KHALFALLAH HAMMOUDA Faten

Transducteurs NooJ

Page 23: KHALFALLAH HAMMOUDA Faten

Transducteurs NooJ

Page 24: KHALFALLAH HAMMOUDA Faten

Transducteurs NooJ

Page 25: KHALFALLAH HAMMOUDA Faten

Transducteurs NooJ

Page 26: KHALFALLAH HAMMOUDA Faten

Transducteurs NooJ

Page 27: KHALFALLAH HAMMOUDA Faten

planplanIntroductionEtat de l’artNoms composés arabesTransducteurs NooJDémarche proposéeExpérimentation et évaluation Conclusion et perspectives

21/04/23 27

Page 28: KHALFALLAH HAMMOUDA Faten

Démarche proposée

Processus de filtrage CorpusRègles lexicales

Liste de noms composés candidats

Opération d’analysePackage de

transducteurs

Liste de noms Composés finale

Dictionnaire de noms composés

Processus d’évaluation

Page 29: KHALFALLAH HAMMOUDA Faten

Démarche proposée

Choix du domaine

Formation manuelle d’un corpus composé d’un nombre

volumineux de mots

Le fait d’avoir un très grand corpus nous permet d’avoir

le maximum des cas possibles de noms composés

Choix du domaine de sport

Page 30: KHALFALLAH HAMMOUDA Faten

Démarche proposée

Page 31: KHALFALLAH HAMMOUDA Faten

planplanIntroductionEtat de l’artNoms composés arabesTransducteurs NooJDémarche proposéeExpérimentation et évaluation Conclusion et perspectives

21/04/23 31

Page 32: KHALFALLAH HAMMOUDA Faten

Expérimentation

Expérimentation et évaluation

Page 33: KHALFALLAH HAMMOUDA Faten

Expérimentation et évaluation

Evaluation

• Silence

• Bruit

• Rappel

• Précision

Nbre de corpus 1 corpus

Nbre de textes 78 textes

Nbre de mots 25000 mots

R= 2000/2500 0,8 (80%)

P= 2000/ 2800 0,71 (71%)

F_mesure 0,74(74%)•F-mesure

Page 34: KHALFALLAH HAMMOUDA Faten

planplanIntroductionEtat de l’artNoms composés arabesTransducteurs NooJDémarche proposéeExpérimentation et évaluation Conclusion et perspectives

21/04/23 34

Page 35: KHALFALLAH HAMMOUDA Faten

Etat de l’art des approches existantes

Définition de concept de noms composés arabes

Description de quelques ambiguïtés liées à la reconnaissance des noms composés arabes

Construction de transducteurs pour l’extraction

Conclusion

Page 36: KHALFALLAH HAMMOUDA Faten

Perspectives

• Transformer le dictionnaire en format .xml

• Analyse sémantique

Page 37: KHALFALLAH HAMMOUDA Faten