Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

37
1 Gestion de l‘information Méthodologie documentaire La recherche documentaire sur internet Jeudi 18 et lundi 22 mars

description

 

Transcript of Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

Page 1: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

1

Gestion de l‘information

Méthodologie documentaire

La recherche documentaire sur internet

Jeudi 18 et lundi 22 mars

Page 2: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

2

Historique

Internet : d’abord un outil des organes de défense des Etats-Unis (années 1970), puis ouvert aux universitaires (années 1980) et finalement aux entreprises privées et au grand public (années 1990) : lancement du World Wide Web en 1991

Pour plus d’informations : se rapporter à la fiche de vocabulaire d’internet

Page 3: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

3

Rappel : Internet n’est pas une bibliothèque ou un centre documentaire !

Internet n’est pas un ensemble organisé et structuré comme une bibliothèque

Les moteurs de recherche ne sont pas des catalogues

Les sites n’ont pas tous une caution intellectuelle ou scientifique comme les ouvrages d’une bibliothèque universitaire : on ne peut pas tout prendre sans précaution!

Page 4: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

4

I. Le Web

Page 5: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

5

Le Web : qu’est-ce que c’est?

Une des applications d’internet (entre autres : courrier électronique, messagerie instantanée…)

Web = ensemble de pages et de sitesInventé plusieurs années après internet,

mais c’est le Web qui a rendu grand public attentif à internet

Page 6: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

6

Du Web 1.0 au Web 2.0

Web 1.0 jusqu’en 2004 : Pages statiques Réseaux

commerciaux Peu d’interactivité Internautes passifs :

consultent seulement Mot-clé

Web 2.0 depuis 2004 : Pages dynamiques Réseaux sociaux Forte interactivité Internautes actifs :

créent et modifient le web

Tag

Page 7: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

7

Outils du Web 2.0 Bureautique en ligne : google docs (traitement de

texte), google spreadsheet (tableur) Les moteurs de recherche spécialisés :

Moovement pour la recherche d’emploi et les stages

Réseaux sociaux virtuels : facebook, myspace …

Echange et partage d’informations, de fichiers, de documents : forums de discussion, youtube, flickr…

Diffusions d’actualités : blogs, fils RSS

Page 8: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

8

Les fils RSS

RSS = Really Simple Syndication Permet la diffusion des dernières nouveautés

sous forme de « fil » Fil d’information : ensemble de titres

d'articles, récemment publiés par un site, qui donnent un lien direct vers l'article complet

Utile pour se tenir au courant de l’actualité dans un domaine donné

Page 9: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

9

Le Web invisible

Web invisible : ensemble de documents du Web qui échappent aux moteurs de recherche les plus courants

Bases de données, archives ouvertes, sites de circulation de littérature grise…

En général ressources du Web invisible sont de plus grande qualité

Beaucoup plus volumineux que le Web visible

Page 10: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

10

II. Les outils de navigation

Page 11: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

11

Quelques rappels/conseils

Sur internet comme sur les catalogues, ou bases de données opérateurs booléens guillemets troncatures

N’hésitez pas à croiser les résultats de plusieurs moteurs de recherche différents

Notions de bruit / silence : trop de résultats ou pas de résultats lorsqu’on fait une recherche sur internet

Page 12: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

12

Les moteurs de recherche / les annuaires Moteurs de

recherche Indexent de manière

automatique beaucoup de sites

Indexation pas nécessairement précise

Ex : Google

Annuaires Indexent un nombre

plus limité de sites : moins exhaustif

Indexation plus précise

Ex: yahoo, voila, google annuaire,…

Page 13: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

13

1.Google

Moteur de recherche le plus utilisé au monde, 87 % du trafic de recherche en France

Construit sur le principe du « Page Rank » = l’indice de popularité d’une page

Page 14: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

14

Recherche avancée

Dans Google la recherche avancée permet de trier par Date du site Langue Pays de localisation Format du document recherché Position du terme recherché dans le

document

Page 15: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

15

Page Rank

Page Rank : calcule le nombre de fois qu’un site X est cité par d’autres sites A, B, C, D…

Mais il prend aussi en compte la popularité des sites A, B, C, D: être cité par des sites qui sont eux mêmes populaires augmente la popularité de X

Inconvénient : des sites récents n’apparaîtront pas tout de suite (pas le temps d’être cités)

Astuce : « J’ai de la chance » ouvre tout de suite le premier site

Page 16: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

16

Google : aspects politiques

Quasi-monopole de la recherche sur internet Censure politique des résultats (sur la

Chine…) Surveillance des données personnelles :

Google enregistre des informations personnelles pendant 18 mois

Hégémonie culturelle

Page 17: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

17

Les avatars de Google

Google maps/ earth : cartes et localisations satellites

Google images/video : recherches d’images et de documents audiovisuels présents dans les pages qui contiennent le mot recherché

Google scholar : recherche de travaux universitaires uniquement

Google books : ouvrages numérisés

Page 18: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

18

Google Scholar

Outil de recherche de travaux universitaires en ligne : thèses, articles, rapports de recherche…

Recherche dans le texte intégral, même si le texte intégral n’est pas accessible à tout le monde

Indique entre crochets le type de résultat : citation, livre…

Page 19: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

19

Google Books (Google Livres) numérisation d’un grand nombre d’ouvrages

de plusieurs grandes bibliothèques (Harvard, Oxford, BM Lyon)

Ouvrages dans le domaine public en entier Ouvrages encore sous droits partiellement

disponibles (sommaire, introduction) Options de recherche avancée

Page 20: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

20

Les enjeux de Google Books

Conditions d’accès : autoroute où on peut à tout moment mettre un péage

Choix des ouvrages : risque de prédominance anglo-saxonne, perte de diversité culturelle

But de la numérisation : accords avec les plateformes de vente (Amazon), plus une incitation d’achat qu’un pas en faveur de l’accès libre

Outils de recherche : moteur de recherche Google n’est pas un catalogue

Page 21: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

21

2. Les alternatives à Google

Suite à l’offensive de Google en 2004, appel de J. N. Jeanneney (ex-président de la BNF) en faveur d’une véritable politique européenne de numérisation

Importance de préserver la pluralité de langues et de cultures

Nécessité d’organiser et de structurer « l’océan » du web

Page 22: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

22

Gallica (Bibliothèque numérique de la BNF)

www.gallica.bnf.fr Ouvrages dans le domaine public (<1939) Beaucoup en mode texte (recherche dans le

texte intégral) Aperçu possible d’ouvrages récents Un compte pour sélectionner et gérer les

documents Possibilité de charger des e-books

Page 23: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

23

Europeana (Bibliothèque numérique européenne )Rassemble les fonds des bibliothèques

nationales européennes et d’autres grandes institutions (archives, fonds audiovisuels, musées…)

Tous types de documentsFrise chronologiqueUn compte pour gérer les documents

Page 24: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

24

3. Les répertoires de signets

Répertoires de sites internet sélectionnés, classés et organisés par des bibliothécaires

http://www.signets-universites.fr/fr/ site lancé en 2009 : signets sélectionnés par les bibliothèques de l’enseignement supérieur, classés par discipline

http://signets.bnf.fr/ répertoire de signets de la BNF, accès par discipline également

Page 25: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

25

III. Wikipedia

Une encyclopédie atypique

Page 26: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

26

Wikipedia : qu’est-ce que c’est?

Wiki = site web dynamique permettant aux internautes de modifier les pages

Wikipedia : encyclopédie collaborative en ligne dont les articles sont écrits par des internautes

Plus de 13 millions d’articles (850 000 en français)

Plus de 250 langues représentées

Page 27: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

27

Wikipedia : comment ça marche?

Contenu fourni par les bénévolesMais financement nécessaire pour la

maintenance du site Wikipedia refuse la publicitéMais fait appel aux dons et à la vente de

produits dérivés (CD-Roms)

Page 28: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

28

Pour ou contre Wikipedia

Avantages : Accès libre Gratuité Mises à jour

régulières et instantanées

Traitement de sujets rares

Plurilinguisme Interactivité

Inconvénients : Variabilité du

contenu Qualité variable des

articles Manque de recul Danger des groupes

de pression Risque

d’amateurisme

Page 29: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

29

Evolution de Wikipedia

Depuis 2007 : nombre d’articles créés en baisse

Mais effort d’amélioration de la qualité : depuis 2009, les articles consacrés à des personnes vivantes doivent désormais être validés par un expert

Page 30: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

30

Une autre encyclopédie gratuite en lignehttp://plato.stanford.edu/ Stanford

encyclopedia of philosophy Véritable comité de rédaction composé

de spécialistes (voir « Editorial Board »)Articles signés, structurés, avec une

bibliographie conséquenteEn anglais

Page 31: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

31

IV. Évaluer un site web

Page 32: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

32

Bouleversements du Web

Le Web permet de s’auto-publier L’étape de validation de l’écrit par un éditeur

n’est plus nécessaire L’anonymat couvre parfois les auteurs La lisibilité des politiques éditoriales tend à

disparaître Généralisation du copié-collé et des

références dont on n’évoque pas les sources

Page 33: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

33

Critères d’évaluation d’un site

Fraîcheur de l’information : date de la dernière mise à jour

Lisibilité des informations éditoriales : auteur, directeur du site…

Lisibilité des sources de financement Qualités de rédaction (bibliographie,

correction grammaticale et orthographique…) Ergonomie et qualité de navigation du site Construction de l’URL

Page 34: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

34

L’URL

URL = Uniform Ressource LocatorAdresse officielle du site internet,

identique pour tous les internautesURL ≠ du nom du siteURL est construite selon une syntaxe

précisePlus l’adresse URL est construite plus

la structure du site est complexe

Page 35: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

35

Structure d’une adresse URL

Protocole internet utilisé : http ou ftpWorld wide web : www Nom de domaineNom de dossierNom(s) de sous-dossier(s)Nom du document (éventuellement)

Page 36: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

36

Exemple

Protocole intenet utilisé http :// (Hypertext transfer protocol)

World wide web : www Nom du domaine : univ-lille3.fr/ Nom de dossier : fr/ nom de dossier (indication de

langue) Noms de sous-dossiers

universite/ composantes-formation/ philosophie/ guides-etudes/

Page 37: Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information

37

URL reconstituée

Au final : http://www.univ-lille3.fr/fr/universite/composantes-formation/philosophie/guide-etudes/