Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information
-
Upload
auvinet-patrice -
Category
Technology
-
view
4.834 -
download
0
description
Transcript of Cours du 17-23 mars - Recherche documentaire sur Internet - Gestion De L’Information
1
Gestion de l‘information
Méthodologie documentaire
La recherche documentaire sur internet
Jeudi 18 et lundi 22 mars
2
Historique
Internet : d’abord un outil des organes de défense des Etats-Unis (années 1970), puis ouvert aux universitaires (années 1980) et finalement aux entreprises privées et au grand public (années 1990) : lancement du World Wide Web en 1991
Pour plus d’informations : se rapporter à la fiche de vocabulaire d’internet
3
Rappel : Internet n’est pas une bibliothèque ou un centre documentaire !
Internet n’est pas un ensemble organisé et structuré comme une bibliothèque
Les moteurs de recherche ne sont pas des catalogues
Les sites n’ont pas tous une caution intellectuelle ou scientifique comme les ouvrages d’une bibliothèque universitaire : on ne peut pas tout prendre sans précaution!
4
I. Le Web
5
Le Web : qu’est-ce que c’est?
Une des applications d’internet (entre autres : courrier électronique, messagerie instantanée…)
Web = ensemble de pages et de sitesInventé plusieurs années après internet,
mais c’est le Web qui a rendu grand public attentif à internet
6
Du Web 1.0 au Web 2.0
Web 1.0 jusqu’en 2004 : Pages statiques Réseaux
commerciaux Peu d’interactivité Internautes passifs :
consultent seulement Mot-clé
Web 2.0 depuis 2004 : Pages dynamiques Réseaux sociaux Forte interactivité Internautes actifs :
créent et modifient le web
Tag
7
Outils du Web 2.0 Bureautique en ligne : google docs (traitement de
texte), google spreadsheet (tableur) Les moteurs de recherche spécialisés :
Moovement pour la recherche d’emploi et les stages
Réseaux sociaux virtuels : facebook, myspace …
Echange et partage d’informations, de fichiers, de documents : forums de discussion, youtube, flickr…
Diffusions d’actualités : blogs, fils RSS
8
Les fils RSS
RSS = Really Simple Syndication Permet la diffusion des dernières nouveautés
sous forme de « fil » Fil d’information : ensemble de titres
d'articles, récemment publiés par un site, qui donnent un lien direct vers l'article complet
Utile pour se tenir au courant de l’actualité dans un domaine donné
9
Le Web invisible
Web invisible : ensemble de documents du Web qui échappent aux moteurs de recherche les plus courants
Bases de données, archives ouvertes, sites de circulation de littérature grise…
En général ressources du Web invisible sont de plus grande qualité
Beaucoup plus volumineux que le Web visible
10
II. Les outils de navigation
11
Quelques rappels/conseils
Sur internet comme sur les catalogues, ou bases de données opérateurs booléens guillemets troncatures
N’hésitez pas à croiser les résultats de plusieurs moteurs de recherche différents
Notions de bruit / silence : trop de résultats ou pas de résultats lorsqu’on fait une recherche sur internet
12
Les moteurs de recherche / les annuaires Moteurs de
recherche Indexent de manière
automatique beaucoup de sites
Indexation pas nécessairement précise
Ex : Google
Annuaires Indexent un nombre
plus limité de sites : moins exhaustif
Indexation plus précise
Ex: yahoo, voila, google annuaire,…
13
1.Google
Moteur de recherche le plus utilisé au monde, 87 % du trafic de recherche en France
Construit sur le principe du « Page Rank » = l’indice de popularité d’une page
14
Recherche avancée
Dans Google la recherche avancée permet de trier par Date du site Langue Pays de localisation Format du document recherché Position du terme recherché dans le
document
15
Page Rank
Page Rank : calcule le nombre de fois qu’un site X est cité par d’autres sites A, B, C, D…
Mais il prend aussi en compte la popularité des sites A, B, C, D: être cité par des sites qui sont eux mêmes populaires augmente la popularité de X
Inconvénient : des sites récents n’apparaîtront pas tout de suite (pas le temps d’être cités)
Astuce : « J’ai de la chance » ouvre tout de suite le premier site
16
Google : aspects politiques
Quasi-monopole de la recherche sur internet Censure politique des résultats (sur la
Chine…) Surveillance des données personnelles :
Google enregistre des informations personnelles pendant 18 mois
Hégémonie culturelle
17
Les avatars de Google
Google maps/ earth : cartes et localisations satellites
Google images/video : recherches d’images et de documents audiovisuels présents dans les pages qui contiennent le mot recherché
Google scholar : recherche de travaux universitaires uniquement
Google books : ouvrages numérisés
18
Google Scholar
Outil de recherche de travaux universitaires en ligne : thèses, articles, rapports de recherche…
Recherche dans le texte intégral, même si le texte intégral n’est pas accessible à tout le monde
Indique entre crochets le type de résultat : citation, livre…
19
Google Books (Google Livres) numérisation d’un grand nombre d’ouvrages
de plusieurs grandes bibliothèques (Harvard, Oxford, BM Lyon)
Ouvrages dans le domaine public en entier Ouvrages encore sous droits partiellement
disponibles (sommaire, introduction) Options de recherche avancée
20
Les enjeux de Google Books
Conditions d’accès : autoroute où on peut à tout moment mettre un péage
Choix des ouvrages : risque de prédominance anglo-saxonne, perte de diversité culturelle
But de la numérisation : accords avec les plateformes de vente (Amazon), plus une incitation d’achat qu’un pas en faveur de l’accès libre
Outils de recherche : moteur de recherche Google n’est pas un catalogue
21
2. Les alternatives à Google
Suite à l’offensive de Google en 2004, appel de J. N. Jeanneney (ex-président de la BNF) en faveur d’une véritable politique européenne de numérisation
Importance de préserver la pluralité de langues et de cultures
Nécessité d’organiser et de structurer « l’océan » du web
22
Gallica (Bibliothèque numérique de la BNF)
www.gallica.bnf.fr Ouvrages dans le domaine public (<1939) Beaucoup en mode texte (recherche dans le
texte intégral) Aperçu possible d’ouvrages récents Un compte pour sélectionner et gérer les
documents Possibilité de charger des e-books
23
Europeana (Bibliothèque numérique européenne )Rassemble les fonds des bibliothèques
nationales européennes et d’autres grandes institutions (archives, fonds audiovisuels, musées…)
Tous types de documentsFrise chronologiqueUn compte pour gérer les documents
24
3. Les répertoires de signets
Répertoires de sites internet sélectionnés, classés et organisés par des bibliothécaires
http://www.signets-universites.fr/fr/ site lancé en 2009 : signets sélectionnés par les bibliothèques de l’enseignement supérieur, classés par discipline
http://signets.bnf.fr/ répertoire de signets de la BNF, accès par discipline également
25
III. Wikipedia
Une encyclopédie atypique
26
Wikipedia : qu’est-ce que c’est?
Wiki = site web dynamique permettant aux internautes de modifier les pages
Wikipedia : encyclopédie collaborative en ligne dont les articles sont écrits par des internautes
Plus de 13 millions d’articles (850 000 en français)
Plus de 250 langues représentées
27
Wikipedia : comment ça marche?
Contenu fourni par les bénévolesMais financement nécessaire pour la
maintenance du site Wikipedia refuse la publicitéMais fait appel aux dons et à la vente de
produits dérivés (CD-Roms)
28
Pour ou contre Wikipedia
Avantages : Accès libre Gratuité Mises à jour
régulières et instantanées
Traitement de sujets rares
Plurilinguisme Interactivité
Inconvénients : Variabilité du
contenu Qualité variable des
articles Manque de recul Danger des groupes
de pression Risque
d’amateurisme
29
Evolution de Wikipedia
Depuis 2007 : nombre d’articles créés en baisse
Mais effort d’amélioration de la qualité : depuis 2009, les articles consacrés à des personnes vivantes doivent désormais être validés par un expert
30
Une autre encyclopédie gratuite en lignehttp://plato.stanford.edu/ Stanford
encyclopedia of philosophy Véritable comité de rédaction composé
de spécialistes (voir « Editorial Board »)Articles signés, structurés, avec une
bibliographie conséquenteEn anglais
31
IV. Évaluer un site web
32
Bouleversements du Web
Le Web permet de s’auto-publier L’étape de validation de l’écrit par un éditeur
n’est plus nécessaire L’anonymat couvre parfois les auteurs La lisibilité des politiques éditoriales tend à
disparaître Généralisation du copié-collé et des
références dont on n’évoque pas les sources
33
Critères d’évaluation d’un site
Fraîcheur de l’information : date de la dernière mise à jour
Lisibilité des informations éditoriales : auteur, directeur du site…
Lisibilité des sources de financement Qualités de rédaction (bibliographie,
correction grammaticale et orthographique…) Ergonomie et qualité de navigation du site Construction de l’URL
34
L’URL
URL = Uniform Ressource LocatorAdresse officielle du site internet,
identique pour tous les internautesURL ≠ du nom du siteURL est construite selon une syntaxe
précisePlus l’adresse URL est construite plus
la structure du site est complexe
35
Structure d’une adresse URL
Protocole internet utilisé : http ou ftpWorld wide web : www Nom de domaineNom de dossierNom(s) de sous-dossier(s)Nom du document (éventuellement)
36
Exemple
Protocole intenet utilisé http :// (Hypertext transfer protocol)
World wide web : www Nom du domaine : univ-lille3.fr/ Nom de dossier : fr/ nom de dossier (indication de
langue) Noms de sous-dossiers
universite/ composantes-formation/ philosophie/ guides-etudes/
37
URL reconstituée
Au final : http://www.univ-lille3.fr/fr/universite/composantes-formation/philosophie/guide-etudes/