Post on 03-Apr-2015
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 1
Pour visionner ce diaporama :
Menu : Diaporama / Visionner le diaporama
Puis laissez-vous guider…
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 2
Du texte papier
…au numérique
… et au PDF
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 3
Nous voici partis pour un petit voyage au pays du "numérique"
• La numérisation et la reconnaissance de caractères
• Je numérise… avec quels réglages ?
• Les images numériques et les différents formats
• Du fichier numérique au format .pdf d'Acrobat
• Un petit tour dans Adobe Acrobat
• Conclusion
Pour avancer, cliquez sur la souris ou sur la touche "entrée" du clavier.Certains compléments sont accessibles par des liens hypertextes soulignés.
Bon voyage…
La numérisation…
…et la reconnaissance de caractères
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 5
Le principe de la numérisation
Un scanner va d'abord produire une image de la page numérisée
A ce stade, nous enregistrerons ce document sous le
format .TIFF de préférence ou.JPEG si l'on veut alléger le
fichier quitte à perdre un peu en qualité
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 6
Le principe de l'OCR
Un scanner va d'abord produire une image de la page numérisée
Dans un second temps, nous pouvons procéder à la reconnaissance de caractère (OCR : Optical Character Recognition)
L'OCR va nous permettre d'obtenir du texte numérique afin :
1] d'enregistrer le texte sous Word ou Excel et de le retravailler
2] de permettre la recherche en texte intégral et d'alléger le poids des
fichiers avec Adobe Acrobat
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 7
Différents outils de numérisation de textes et d'OCR
Parmi les outils les plus connus sur le marché actuellement nous allons évoquer :
Omnipage
Acrobat
L’un des premiers et des plus connus
• Permet principalement de récupérer le texte sous Word ou Excel afin de le retravailler
• Lors de l’OCR, les premières versions perdaient la mise en forme, les versions récentes semblent plus fiables.
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 8
Différents outils de numérisation de textes et d'OCR
Parmi les outils les plus connus sur le marché actuellement nous allons évoquer :
Omnipage
Acrobat
Un logiciel apparu avec le web
• Permet la numérisation de textes complexes (avec images) en conservant la forme du document
• Permet l’OCR normale ou avec texte caché
• Permet d’optimiser le poids des fichiers pour le web ou les CDRom
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 9
Si vous numérisezavec OmniPage
Le premier stade de la numérisation transforme le document papier en fichier "image"
Dans un second temps, OmniPage procède à l’OCR et propose différents réglages selon le type de document
Il vous signale les corrections à faire
Vous choisissez le format d'enregistrement (Word, Excel, Pdf, etc.)
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 10
Si vous numérisezavec Acrobat
Vous obtiendrez directement un fichier au format .pdf : Menu : Fichier / Importer / Scan La fenêtre du logiciel de numérisation s'affiche afin que
vous procédiez aux réglages Après la numérisation, le document s'ouvre
automatiquement dans Acrobat Vous l'enregistrez Vous procédez à l'OCR si nécessaire
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 11
Pour effectuer l'OCRavec Acrobat
Vous pouvez effectuer l'OCR sur tout ou partie des pages :Menu : Outil / PaperCapture / reconnaître des pagesProcédez au réglage des préférences : la langue, le
choix entre l'OCR normale ou en texte caché
Vous pouvez effectuer l'OCR avec deux options : OCR Normale, qui remplace l'image écran par le texte
reconnu OCR avec Texte caché qui conserve l'image écran et
effectue la reconnaissance en arrière-plan
Je numérise…
…avec quels réglages ?
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 15
Les choix à faire
Pour numériser un document,je dois choisir :
Le type de sortie
La zone à numériser
La taille de sortie
La résolution
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 16
Le type de sortie
Si le texte a plus d'importance que les photos, choisissez : Texte : idéal pour scanner du texte et effectuer l'OCR Dessin NB : si vous avez à la fois du texte et des graphiques Dessin couleur : si le graphique risque d'être illisible en noir et
blanc
Il faut choisir le type de sortie en fonction de la qualité qualité de l'originalde l'original et de la destination finaledestination finale du document numérique
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 17
Le type de sortie
Si les photos ont plus d'importance que le texte, choisissez : Photographie noir et blanc : préserve les niveaux de gris et
dégradés Photographie couleur : en 256 couleurs ou en millions de
couleurs, ce type de sortie génère des fichiers très lourds.
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 18
La zone à numériser
Pour modifier la zone à numériser : Positionnez la souris sur une "poignée" : rectangle blanc au bord
du cadre représentant la zone à numériser Cliquez et déplacez la souris pour redimensionner ce cadre
Il faut cadrer la zone de numérisation au plus juste car chaque espace numérisé représente des pixels, donc du poids sur le fichier
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 20
La taille de sortie
Si vous agrandissez une image numérisée de plus de 20%, elle sera de mauvaise qualité Les pixels constituant l'image ne doivent pas être trop agrandis
car ils deviennent alors visibles pour l'œil humain et l'image perd de sa finesse
Il faut régler la taille de sortie au plus juste pour gérer le gérer le poids du fichierpoids du fichier et préserver la qualité de l'imagequalité de l'image
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 21
La résolution
Pour numériser du texte en vue de pratiquer l'OCR: Choisir une résolution de 300 dpi
Pour numériser une image : Pour un affichage écran uniquement : 72 dpi Pour une impression laser : 150 dpi Pour une impression de qualité : 300 dpi
Il faut régler la résolution au plus juste pour gérer le gérer le poids du fichierpoids du fichier tout en préservant la qualité de l'imagequalité de l'image
Les images numériques…
…et les différents formats
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 24
Les formats d'image les plus courants
BMPTIFFGIFFJPEGPDF
Bitmap
• Compatible avec tous les systèmes• Chaque pixel est stocké avec son code de
couleur• Pas utilisé sur internet
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 25
Les formats d'image les plus courants
BMPTIFFGIFFJPEGPDF
Tag Image File Format
• Format très utilisé en édition électronique• Préserve la qualité du fichier• Relativement lourd mais différents taux de
compression sont possibles• Existe sous diverses variantes selon les
logiciels, ce qui peut poser des problèmes
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 26
Les formats d'image les plus courants
BMPTIFFGIFFJPEGPDF
Compuser Graphics
• Format "propriétaire", attention aux droits d'utilisation
• Supporte 256 couleurs avec palette• Adapté aux dessins ou graphiques• Permet de faire des Giff animés• Bon taux de compression en préservant la
qualité
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 27
Les formats d'image les plus courants
BMPTIFFGIFFJPEGPDF
Joint Photo Expert Group
• Format non propriétaire, libre de droits• La perte de qualité est plus sensible qu'avec
le GIF• Adapté à la compression d'images de qualité
photographique• Très utilisé sur internet
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 28
Les formats d'image les plus courants
BMPTIFFGIFFJPEGPDF
Portable Document Format• Format de document électronique basé sur le
langage Postscript d'Adobe• Un document PDF s'affiche sur n'importe
quel type de système informatique tout en conservant l'allure originale du document
• Cet affichage se fait à l'aide du logiciel Acrobat Reader d'Adobe qui est distribué gratuitement sur Internet.
Du fichier numérique…
…au format .pdf d'Acrobat
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 30
Si vous avez des fichiers au format image .Tiff
Le format Tiff est le format le plus classique de récupération des fichiers numérisés en tant qu'image.
Ce format est très utilisé en PAO (Publication Assistée par
Ordinateur). Il est relativement lourd mais préserve la qualité du
document
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 31
Si vous avez des fichiers au format image .Tiff
Le format Tiff est le format le plus classique de récupération des fichiers numérisés en tant qu'image.
Pour pouvoir pratiquer l'OCR sur ces fichiers avec Acrobat : Les enregistrer au format .pdf via un logiciel de
gestion d'image (Photoshop, PaintBrush, etc.) ou bien
Les importer directement dans Acrobat, ce qui permet de regrouper jusqu'à 50 pages dans un même fichier
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 33
Si vous avez des fichiers sous forme numérique
Vous voulez transformer un fichier existant en un fichier .pdf :
Si le fichier est simple (Word, Excel, pas d'image, pas de mise en page complexe)
Vous pouvez utiliser Acrobat Distiller ou Acrobat Writer, deux annexes au logiciel Acrobat qui
produisent directement un fichier .pdf
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 35
Si vous avez des fichiers sous forme numérique
Vous voulez transformer un fichier existant en un fichier .pdf : Si le fichier est complexe (Xpress, Publisher)
Il faut d'abord enregistrer le fichier au format PostScript (.ps)Ensuite, il faut convertir ce fichier, via Acrobat Distiller, au format .pdf
Cette procédure est plus longue mais permet :• d'obtenir un résultat conforme à l'original,
• de gérer les polices, la compression des images,la conversion des couleurs
• d'optimiser le fichier pour l'utilisation finale (écran ou impression)
Un petit tour…
…dans Adobe Acrobat
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 37
La navigation dans Acrobat
Pour se déplacer dans un fichier Acrobat, on peut utiliser :
Les vues miniatures
Les signets
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 40
L'optimisation des fichiers
Elle permet de diminuer le poids des fichiers .pdf : Rangez vos fichiers à optimiser dans un répertoire
commun Fermez vos fichiers mais restez dans Acrobat :
Fichier / Optimiser un dossier
L'optimisation est efficace sur du texte numérique (après OCR), pas sur les images
Conclusion
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 42
Quelques bonnes adresses
Pour en savoir plus sur la numérisation et les formats d'images : http://www.ccr.jussieu.fr/urfist/image_numerique
/home.htm http://www.multimania.com/imgnum/intro.html http://www.pixelactu.com/
Pour en savoir plus sur Adobe Acrobat http://www.adobe.fr
IAM.M - CRSP Du papier au fichier numérique – Octobre 2000 43
Rien n'est figé !…
Nous vous avons présenté les possibilités du logiciel Adobe Acrobat dans la numérisation et la mise en ligne de fichiers textes, car nous l'avons pratiqué, mais ATTENTION !!
Notre expérience ne doit pas vous apparaître comme la seule "bonne parole", il faut• rester attentifs aux outils qui sont inventés tous les jours,• penser à partager nos expériences mutuelles.
A bientôt autour de projets communs