Download - Textométrie - Tableau comparatif

Transcript
Page 1: Textométrie - Tableau comparatif

Acquisition Url

http://www.image-zafar.com/index_alceste.htm

http://www.antlab.sci.waseda.ac.jp/antconc_index.html

http://laseldi.univ-fcomte.fr/document/viprey/page_JMV.htm

http://williammartinez.fr/coocs/page.php

http://ses.telecom-paristech.fr/lebart/05_Logiciel.html

http://ancilla.unice.fr/~brunet/pub/hyperbase.htmlhttp://hyperpo.org/

http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/lexico3.htm

http://www.athel.com/mono.html

http://www.nooj4nlp.net/

http://philologic.uchicago.edu/

http://www.ling.uqam.ca/ato/sato/

http://spadsoft.com/content/view/20/49/

http://www.lesphinx-developpement.fr/fr/accueil/accueil_sphinx.php

http://www.chass.utoronto.ca/tact/

http://www.taltac.it/it/index.shtml

http://textometrie.sourceforge.net/

http://tal.univ-paris3.fr/trameur/

http://www.treecloud.org

http://www.acetic.fr/tropesfr.htm

http://www.xaira.org/

http://weblex.ens-lsh.fr/wlx/

http://www.grimmersoft.com/grimmersoft/cms/37/wordmapper.dhtml

http://www.lexically.net/wordsmith/

http://www.cavi.univ-paris3.fr/ilpga/ilpga/sfleury/helpmodules/help_edxml.htm

Acquisition Licence Interface web Shareware Shareware GPL Freeware GPL Shareware Shareware Shareware

Acquisition Prix Sur devis Freeware

Prototypeexpérimentalgratuit

Freeware (versionacadémique)

Freeware (versionacadémique)

145€, versiond'évaluationgratuite

150€ (v.3), 0€ (v.1,2)

85 $ (free demoversion) 0 €

Versiond'évaluationgratuite aprèsremplissage d'unformulaire 50 $ De 25 € à 1500 € 0 € 0 € 0 € (démo), 1435 € 0 €

950 €. Démoinaccessible enjuin 2009 65 €

Acquisition Manuel utilisateur

http://www.antlab.sci.waseda.ac.jp/software/AntConc_Help/AntConc_Help.htmInclus Inclus Inclus

Manuelsd'utilisation etexempledd'explorationstéléchargeablessur le site

http://www.athel.com/tour.pdf

http://www.nooj4nlp.net/pages/references.html Inclus

En anglais : http://www.chass.utoronto.ca/tact/TACT/tact0.html- en français : http://www.chass.utoronto.ca/~wulfric/articles2/poitiers2001/

http://issuu.com/sfleury/docs/lemetierlexicometrique/

Inclus, http://www.lirmm.fr/~gambette/ProgramTreecloudPython/ManualTreecloud.pdf

http://weblex.ens-lsh.fr/doc/weblex/

http://www.lexically.net/downloads/version5/HTML/index.html

http://textopol.free.fr/Documents/edXML/ManuelEdxml.pdf

Acquisition Langue du logiciel Français, anglais Anglais FrançaisFrançais, anglais,espgnol Français Français Anglais Français Anglais

Français, anglais,espagnol Français, anglais Anglais Italien, Anglais Français Français, anglais

Français, anglais,portugais,espagnol Anglais

Acquisition Système d'exploitationWindows XP,Vista, MacOsX

Windows, Linux,Mac Windows Windows Windows Windows Windows DOS

Windows, Linux,Mac (interfacegraphiqueuniquementWindows) Windows

Conception Auteur(s) Max Reinert Laurence Anthony Jean-Marie Viprey William Martinez Ludovic Lebart Etienne Brunet Stéphan Sinclair

André Salem,Cédric Lamalle,William Martinez,Serge Fleury Michael Barlow Max Silberztein François Daoust

John Bradley, IanLancashire, LidioPresutti, MichaelStairs

Sergio Bolasco,FrancescoBaiocchi, AdolfoMorrone... Serge Heiden... Serge Fleury Philippe Gambette Lou Bernard Serge Heiden

Jean-FrançoisGrimmer Mike Scott Calin-Ioan Mosut

Valérie Beaudouin,François Yvon

Conception OrganismeSociété Image(Toulouse)

Celese (WasedaUniversity)

ATST/Laseldi(UFC) SYLED (Paris 3)

TELECOM-ParisTech / CNRS

BCL (Université deNice SophiaAntipolis)

CSMM dpt.(McMasterUniversity) CLA²T (Paris 3) Société Athelstan Laseldi (UFC) ATO (UQAM) Société SpadSoft

Société Le SphinxDéveloppement

IBM - University ofToronto

DSGSSAR(Sapienza,Université deRome) ANR CLA²T (Paris 3)

LIRMM (UniversitéMontpellier 2) Société Acetic Oxford University

Icar (ENS LSHLyon)

SociétéGrimmersoft

Oxford UniversityPress CLA²T (Paris 3)

Conception Langage de programmation Perl Visual Basic C++ Librairie Java PythonPrétraitement : Format d'entrée Format texte Format texte Format Lexico 3 Format texte Format texte Format texte Format texte, XML

Prétraitement :Caractères spéciaux dans leformat d'entrée $$$ < > *

Prétraitement :Catégorisation morpho-syntaxique

Prétraitement : Analyse morpho-syntaxique Non

Prétraitement :Antidictionnaire / suppression demots

Français, anglais,allemand,personnalisé

Prétraitement :Lemmatisation / remplacementde mots

Lemmatisation etremplacementavec Diatag

Remplacement demots

LemmatisationTreetagger(paramétréfrançais intégré)

Lemmatisationmaison pourl'italien,TreeTagger pourautres langues Non

Prétraitement : Segmentation mots

Choix descaractèresséparateurs demots

Choix descaractèresséparateurs demots

Caractèresséparateurs :ponctuationPython

Prétraitement :

Segmentation textes /découpage en parties (uneseule partition, plusieurspossibles ? possibilité deredéfinir les parties ?) Ok Non

Prétraitement :Découpage par parties : aperçude la syntaxe

$$$ Partie 1,Part1,P1 $$$ <partie=p1> Personnalisable

Comptage :Nombre de mots, de formesdifférentes

Recherche :KWOC (liste des formes ou descatégories) Oui, fréquence

Oui, aussi liste delocutions de lieu,nationalités... Oui, fréquence

Recherche :KWAC (concordance,possibilités de tris multiples)

Oui, taille fixe, tri àdroite et gauche

Oui, taille fixe, tri àgauche

Oui, taille fixe, parphrase, tri àgauche, à droite

Oui, concordancede groupes demots Non

Recherche : KWIC (contextes) NonRecherche : KWUT (texte surligné) Non

Objet de recherche :Filtre (expressions régulières,troncature)

Préfixes(également dans laconcordance)

Préfixes, suffixes,expressionsrégulières Non

Objet de recherche :

Catégories codées dans lecorpus (lemmes par ex.).Possibilité de superposerdifférents types de catégories Ok Non

Objet de recherche :

Recherche simultanée deplusieurs motifs (schéma demotifs consécutifs ou bien avecdiscontinuités)

Oui pour lesformesgraphiques, avecdiscontinuités

Oui pour lesschémassyntaxiques sansdiscontinuité Oui Non

Formesremarquables : Spécificité

Oui (valeursréelles), graphique

Oui (valeursentières),graphique, surtextes sélectionnésdepuis AFC Oui (TF-IDF) Non

Formesremarquables :

Collocation et segments répétés(organisation : triables parlongueur, fréquence,significativité)

Mutual information,t-score Oui

Oui (fenêtreglissante de taille2), choix dedistance

Formesremarquables : Cooccurrences

Oui (modèlehypergéométrique)

Oui, choix dedistance (parmi 13formules)

Formesremarquables :

Lieu du calcul de lacooccurrence (fenêtre de taillefixe, phrase, paragraphe, partie)

Fenêtre de taillefixe ou partie

Formesremarquables :

Cooccurrences autour d'un pôledonné

Fournir laconcordance dupôle en entrée dulogiciel

Formesremarquables :

Polycooccurrences (occcurrencesimultanée de plusieurs termesdans un même bloc)

Oui, visualisationpar des cheminsde cooccurrence

Visualisation : Position d'un mot au fil du texte Concordance plotRecherche plein-texte

Graphique desfréquencesabsolues,relatives, cartes desections,ensembles demots Non

Visualisation : Analyse factorielleOui (projection surune sphère) Oui

Oui, des textes etdes mots Oui, des textes

Ok, des mots etdes textes Non

Visualisation :

Fiabilité de l'analyse factorielle(ellipses de bootstrap,diagramme de contribution descomposantes)

Diagramme decontribution descomposantes

Oui, ellipses debootstrap

Oui, valeur debootstrap pourl'arbre

Visualisation :Analyse arborée (intratextuelleou intertextuelle)

Oui, limitée à 50feuilles,intratextuelle ouintertextuelle,décoration parcouleurs

Analyse arboréeintratextuelle,décoration parcouleurs et taillede police variable

Visualisation :

Fiabilité de l'analyse arborée(valeurs de bootstrap sur lesarêtes, sur l'arbre)

Visualisation : Carte auto-organisatrice Oui Non

Visualisation :Fiabilité de la carte auto-organisatrice (U-matrix)

Visualisation :Graphe de cooccurrence,lexicogramme (filtrage ?)

Oui, filtré pardegré decooccurrence Oui Non Ok Ok Ok

Ergonomie : Lien entre fonctionnalitésRetour au textepar clic

Recours auglisser-déplacerpour faire le lienentre listes etvisualisations Non

Ergonomie : Historique de navigation

Non, sauvegardedes derniersparamètres utilisésdans l'interfacegraphiqueWindows

Ergonomie : Export

Matrice decooccurrenceexportée en .csv,arbre exporté en .nexus ou .newick

Ergonomie :Possibilité d'appelerautomatiquement le programme Non Oui

Limites : Taille

au-delà de 3 Mode corpus, choisirversion supérieureà 4.6

22.500 répondants(individus, lignes),1.000 variables(numériques ounominales),100.000caractères pour lesréponses d'unindividu à desquestionsouvertes. 10^7 mots 10^7 mots

Limite inconnue,chargement de400,000 mots en30 secondes

Thèmes Logiciels : Alceste AntConc Astartex-Diatag CooCS DtmVic Hyperbase Hyperpo Lexico3 MonoConc Nooj (Intex) PhiloLogic SATO Spad Sphinx-Lexica Tact TalTac TextometrieTrameur (MétierLexicométrique) TreeCloud Tropes Xaira

Weblex(Lexploreur) Wordmapper Wordsmith

A tester, insertionpossible : edxml Métromètre

Page 2: Textométrie - Tableau comparatif

Limites : Nombre de textes 76 textes

« there may be alimit on the numberof files loaded »

Version 5.5 :Dépassement decapacité pouranalyse des corresbinaires à fichierWesley 1-74 d’environ 385.000occurrences ou 2,2Mo

1, éventuellementsegmenté enfenêtres decooccurrences ennombre illimité

Thèmes Logiciels : Alceste AntConc Astartex-Diatag CooCS DtmVic Hyperbase Hyperpo Lexico3 MonoConc Nooj (Intex) PhiloLogic SATO Spad Sphinx-Lexica Tact TalTac TextometrieTrameur (MétierLexicométrique) TreeCloud Tropes Xaira

Weblex(Lexploreur) Wordmapper Wordsmith

A tester, insertionpossible : edxml Métromètre