第 4 章 文本与图形图像资源获取与处理

44
Company LOGO 第 4 第 第第第第第第第第第第第第第第

description

第 4 章 文本与图形图像资源获取与处理. Contents. 4.1 文本资源的获取与处理. 4.2 图形、图像资源获取与处理. 4.1 文本资源的获取与处理. 4.1.1 文本概述. 文本是文字、数字和符号的统称,是最常 用也是最基本的多媒体素材。 文本文件: TXT 、 DOC 、 WPS 、 PDF. 4.1.2 文本的获取. 4.1 文本资源的获取与处理. 键盘输入: 主要的输入方法。通过键盘,英文信息可直接输入;中文信息则通过不同的中文输入编码来完成。 键盘输入法按编码原理可分为: - PowerPoint PPT Presentation

Transcript of 第 4 章 文本与图形图像资源获取与处理

Page 1: 第 4 章 文本与图形图像资源获取与处理

Company

LOGO

第 4 章 文本与图形图像资源获取与处理

Page 2: 第 4 章 文本与图形图像资源获取与处理

Company Logo

Contents

4.2 图形、图像资源获取与处理

4.1 文本资源的获取与处理

Page 3: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.1 文本资源的获取与处理

4.1.1 文本概述 文本是文字、数字和符号的统称,是最常 用也是最基本的多媒体素材。 文本文件: TXT 、 DOC 、 WPS 、 PDF

Page 4: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.1.2 文本的获取 键盘输入:主要的输入方法。通过键盘,英文信息可

直接输入;中文信息则通过不同的中文输入编码来完成。

键盘输入法按编码原理可分为: 音码输入法,如全拼、智能 ABC 、拼音加加、智能狂

拼、谷歌输入法、搜狗输入法、 QQ 输入法等; 形码输入法,如五笔、郑码等; 音形码输入法,如二笔、自然码、一笔等;

4.1 文本资源的获取与处理

Page 5: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.1 文本资源的获取与处理

软键盘输入,可输入一些特殊的符号。

4.1.2 文本的获取

Page 6: 第 4 章 文本与图形图像资源获取与处理

Company Logo

手写输入:一种非常人性化的中英文输入法,适合于不习惯键盘操作的人群和没有标准英文键盘的场合 ,指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程。

4.1 文本资源的获取与处理

4.1.2 文本的获取

Page 7: 第 4 章 文本与图形图像资源获取与处理

Company Logo

语音输入:语音输入是通过计算机中的音频处理系统(主要包括声卡和麦克风),采集处理人的语音信息,再经过语音识别处理,将说话内容转换成对应的文字完成输入。如: IBM ViaVoice Pro 简体中文版

4.1 文本资源的获取与处理

4.1.2 文本的获取

Page 8: 第 4 章 文本与图形图像资源获取与处理

Company Logo

OCR 输入:是指用扫描仪将印刷文字以图像的方式扫描到计算机中,再用 OCR 文字识别软件将图像中的文字识别出来,并转换为文本格式的文件,完成文本信息的输入。

4.1 文本资源的获取与处理

4.1.2 文本的获取

Page 9: 第 4 章 文本与图形图像资源获取与处理

Company Logo

要将大量的印刷体形中手写体文字转换成电子文本素材,常用的方法是通过扫描仪扫描后,再使用OCR 文字识别技术将其识别转换为电子文本。 OCR是 Optical Character Recognition 的简称,即光学字符识别技术。常用的 OCR 文字识别软件有:汉王OCR 、清华紫光 TH-OCR 、中晶尚书 OCR ,丹青OCR 等。下面以汉王 OCR6.0 为例,来介绍如何对扫描后的图像进行文字识别。

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 10: 第 4 章 文本与图形图像资源获取与处理

Company Logo

汉王 OCR6.0 界面

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 11: 第 4 章 文本与图形图像资源获取与处理

Company Logo

打开扫描后的图像 图像反白 本软件只处理白底黑字的图像,若扫描得到的图像不

是白底黑字,点“编辑”菜单中的“图像反白”命令作反白处理。

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 12: 第 4 章 文本与图形图像资源获取与处理

Company Logo

旋转图像 若发现当前图像不是正常位置显示,选择“编辑”菜单

内的“旋转图像”菜单项,再选择相应的旋转方向,按 90 度旋转当前图像(可以连续旋转),将当前图像旋转到正常位置。

倾斜校正 自动倾斜校正 若扫描后的图像是倾斜的,按系统测定的角度自动 倾

斜校正。选择“编辑”菜单的“自动倾斜校正”,可以对倾斜的图像作自动倾斜校正使之正常显示。

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 13: 第 4 章 文本与图形图像资源获取与处理

Company Logo

手动倾斜校正: 若图像是倾斜的或自动倾斜校正效果不佳,可选择“编

辑”菜单中的“手动倾斜校正”,出现如图接口,手工调整横竖坐标,进行校正操作。

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 14: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 15: 第 4 章 文本与图形图像资源获取与处理

Company Logo

剪切噪音 点击工具栏中的按钮 ,按住鼠标左键,拖动鼠标选中

图像中的噪音(黑点或黑框),放开鼠标左键,就可以将噪音清除。

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 16: 第 4 章 文本与图形图像资源获取与处理

Company Logo

版面分析 移动游标箭头到文件图像上的适当位置(例如文章段首),按住鼠标左键不放,拖动至另一适当位置(例如文章段尾),再放开左键,划分出所要识别的图像框图(见图像框线),重复此操作,以划分出全部图像框的框图。另外,还可以定义各图像框的版面属性为横栏、竖栏、表格、图像。

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 17: 第 4 章 文本与图形图像资源获取与处理

Company Logo

识别图像和检查识别结果 选中要识别的图像页,单击按钮或单击“识别”菜单

中的“开始识别”命令,对所选图像进行版面识别。 识别过的图像,系统会将识别结果在识别窗口中显示出来。如果没有识别的图像,识别窗口为灰色,所以识别完图像后,应该检查有没有图像页是否有没识别的图像块。

 

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 18: 第 4 章 文本与图形图像资源获取与处理

Company Logo

字符校对 如果在识别图像前,有些噪音没去掉,或图像校正不是很准确,识

别出的文字会不太准确。

出现的红字,便是识别不出来的字体,如果错字少,可以直接进行输入校正,但建议把噪音全部去除、图像校正准确后,再进行识别。

 

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 19: 第 4 章 文本与图形图像资源获取与处理

Company Logo

输出文本  

4.1 文本资源的获取与处理

4.1.3  扫描识别 ——汉王 OCR

Page 20: 第 4 章 文本与图形图像资源获取与处理

Company Logo

一般情况下,网页上文本内容可以直接选择复制下来,或者直接保存为网页文件或文本文件。但是,也有一些网页上的文本内容不能直接被选择和复制,也不能被保存为网页文件或文本文件。为了获得这些网页上的文本素材,可采用以下方法。

4.1 文本资源的获取与处理

4.1.4  网页文本素材的下载和处理

Page 21: 第 4 章 文本与图形图像资源获取与处理

Company Logo

1 、在网页的空白处用鼠标右击,在快捷菜单中选择“查看源文件”,弹出网页的源文件编辑窗口。该窗口一般是记事本窗口。

2 、查看该文件的内容,将正文前的所有内容删除,然后保存为文本文件。

3 、将保存的文件的扩展名 .txt改为网页文件的扩展名 .htm 。

4 、再次打开该文件后,文本内容就可以被复制下来。 

4.1 文本资源的获取与处理

4.1.4  网页文本素材的下载和处理

Page 22: 第 4 章 文本与图形图像资源获取与处理

Company Logo

不能复制内容或将网页另存的情况举例 http://zzzy.chinacourt.org/public/paperview.php?

id=102914

4.1 文本资源的获取与处理

4.1.4  网页文本素材的下载和处理

Page 23: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.1 文本资源的获取与处理

4.1.4  网页文本素材的下载和处理

Page 24: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

 课件中使用的图片有两种形式,即矢量图形和位图图像。

图形,又称矢量图,是用一组指令来描述几何图形的点、线、框、圆、面等元素,如 office家族,“插入”菜单中的“剪贴画”或“自选图形”等,皆为矢量图形,可直接用绘图工具进行绘制,不文不详细介绍。其特点是:放大后不失真,文件数据量小。网络上比较流行的 flash便是矢量动画。

位图,主要用于表示真实照片图像和包含复杂细节的绘画等,其特点是:放大后易失真,文件数据量大。

4.2.1 图形、图像概述

Page 25: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.1 图形、图像概述

Page 26: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.1 图形、图像概述 文件格式: 点阵图形图像文件    BMP ( Bitmap )、 GIF ( Graphics

Interchange Format )、 TIF/TIFF ( Tag Image File Format )

数学描述图形图像文件    WMF ( Windows Metafile

Format )、 EMF ( Enhanced Meta File ) 、 ICO ( Icon file )    JPG/JPEG

( Joint Photographic Expert Group )

Page 27: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.2 图像资源的获取途径和方法 从光盘中获取 从互联网获取

Page 28: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.2 图像资源的获取途径和方法 从外部设备获取

屏幕图像的截取除了可以使用 windows提供的 printscreen

按键的方法外,还可以使用各种截图软件,如 SnagIt 。

Page 29: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

PS 是电脑上的图像处理软件 Photoshop 的缩写,教师要掌握课件中图片素材的应用及处理, PS 是首选处理工具之一,这也是课件制作功必须掌握的基本功。

新建并保存文件。文件名为“荷塘月色”,文件扩展名 .psd 。

Page 30: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

用 PS 处理课件位图素材 打开图像

Page 31: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop 修复图像 仿制图章工具 ,去除月色图片上的呢图网标识。 操作要领:先点选图章工具,然后按照 ALT ,再用图章

工具去选择画面上需要复制的点,放开 ALT ,用图章工具去需用粘贴的画面部分点击。

Page 32: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

添加滤镜特效 “滤镜”——“模糊”——“表面模糊”

Page 33: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

保存图像为“月色处理 .psd”

Page 34: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

调整亮度——对比度“图像”——“调整”——“亮度 / 对比度”

Page 35: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

Page 36: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop 调整图像大小“ 图像”——“图像大小”

保存图像为“荷花 1 处理 .psd”

Page 37: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop 磁性套索工具选择选区(如下左图),反选(“选择”——“反向”)

按 delete去除图像背景

保存图像为“荷花 2 处理 .psd”

Page 38: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

另注:对于大片的相同或者相近色,可以用魔棒工具 或魔术橡皮擦工具  等来去除背景,如:

Page 39: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

 背景有没完全去除,可以在其图层下方新建一填充和前景反差大的颜色的图层来查看,如下图所示,可以发现背景并没有去除干净,这时,可配合橡皮擦或套索工具来进一步擦除。

Page 40: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop 合成图像1 )将以上三张处理后的图像,分别用移动工具拖至荷塘月色 .psd 中。2 )“编辑”——“自由变换” ,调整图像至合适比例,按回车确认变

换。3 )根据需要,适当调整色相 /饱和度或亮度 / 对比度。

Page 41: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

4 )将两朵荷花所在的图层,按 ctrl 选中,右键合并图层。5 )添加图层蒙版 ,拉由黑到白的渐变 ,使其过度自然。 图层蒙版是一项非常有用的技术,它可以遮盖掉图层中你不需要的部分,而不必真正破坏图层的像素。

注:蒙版中黑色部分,作用于相应图层,则使该部分完全透明。蒙版中白色部分,作用于相应图层,对图层无影响,即图层完全不透明。

Page 42: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop

Page 43: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop 添加文字效果  添加文字,并利用图层面板上的“添加图层样式”

  ,给文字添加外发光效果。

Page 44: 第 4 章 文本与图形图像资源获取与处理

Company Logo

4.2 图形、图像资源获取与处理

4.2.3 图像素材的处理—— photoshop 优化并输出图像(“文件”——“存储为 Web所用格式” )

在 photoshop 中处理的图像存储为 web 格式,可以较大程度地优化图像文件,使图像文件和图像文件大小有较高的平衡点,在保证图像质量的前提下,可以使文件更小。