如何使用扫描仪在文档被扫描进电脑后,如何转变成可编辑的文件?
在被扫描进电脑后,如何转变成可编辑的文件?
扫描仪已经成了我们日常办公和的必备产品。多了解一些扫描仪的使用保养常识有利于提高工作效率。 检测与评价 通常消费者在选购扫描仪产品的时候,往往只注意说明书上标注的技术指标,但是多少dpi扫描分辨率、多少bit色彩位数,已经不能完全反映一台扫描仪的质量好坏。下面以中晶科技公司出品的Microtek扫描仪为例,提供一些简单的方法,可以对扫描仪的感光元件质量、传动机构、分辨率、灰度级、色彩等性能进行简单有效的检测,以使消费者不会因为贪图便宜而吃亏上当。 1.检测感光元件:扫描一组水平细线(如头发丝或金属丝),然后在ACDSee 32中浏览,将比例设置为100%观察,如纵向有断线现象,说明感光元件排列不均匀或有坏块。 2.检测传动机构:扫描一张扫描仪幅面大小的图片,在ACDSee 32中浏览,将比例设置为100%观察,如横向有撕裂现象或能观察出的水平线,说明传动机构有机械故障。 3.检测分辨率:用扫描仪标称的分辨率(如300dpi、600dpi)扫描彩色照片,然后在ACDSee 32中浏览,将比例设置为l00%观察,不会观察到混杂色块为合格,否则分辨率不足。 4.检测灰度级:选择扫描仪标称的灰度级,扫描一张带有灯光的夜景照片,注意观察亮处和暗处之间的层次,灰度级高的扫描仪,对图像细节(特别是暗区)的表现较好。 5.检测色彩位数:选择扫描仪标称色彩位数,扫描一张色彩丰富的彩照,将显示器的显示模式设置为真彩色,与原稿比较一下,观察色彩是否饱满,有无偏色现象。要注意的是:与原稿完全一致的情况是没有的,显示器有可能产生色偏,以致影响观察,扫描仪的感光系统也会产生一定的色偏。大多数高、中档扫描仪均带有色彩校正软件,但仅有少数低档扫描仪才带有色彩校正软件,请先进行显示器、扫描仪的色彩校准,再进行检测。 6.OCR文字识别输入检测:扫描一张自带印刷稿,采用黑白二值、标称分辨率进行扫描,300dpi的扫描仪能对报纸上的5号字作出正确的识别,600dpi的扫描仪几乎能认清名片上的7号字。 使用和保养 作为普通用户来说,不仅要购买一台质量过关、方便耐用的扫描仪产品,而且学会正确使用和进行简单的保养也是非常重要的。 1.一旦扫描仪通电后,千万不要热插拔SCSI、EPP接口的电缆,这样会损坏扫描仪或计算机,当然USB接口除外,因为它本身就支持热插拔。 2.扫描仪在工作时请不要中途切断电源,一般要等到扫描仪的镜组完全归位后,再切断电源,这对扫描仪电路芯片的正常工作是非常有意义的。 3.由于一些CCD的扫描仪可以扫小型立体物品,所仪在扫描时应当注意:放置锋利物品时不要随便移动以免划伤玻璃,包括反射稿上的钉书针;放下上盖时不要用力过猛,以免打碎玻璃。 4.一些扫描仪在设计上并没有完全切断电源的开关,当用户不用时,扫描仪的灯管依然是亮着的,由于扫描仪灯管也是消耗品(可以类比于日光灯,但是持续使用时间要长很多),所以建议用户在不用时切断电源。 5.扫描仪应该摆放在远离窗户的地方,应为窗户附近的灰尘比较多,而且会受到阳光的直射,会减少塑料部件的使用寿命。 6.由于扫描仪在工作中会产生静电,从而吸附大量灰尘进入机体影响镜组的工作。因此,不要用容易掉渣儿的织物来覆盖(绒制品,棉织品等),可以用丝绸或蜡染布等进行覆盖,房间适当的湿度可以避免灰尘对扫描仪的影响。 扫描仪使用常见问题 1.打开扫描仪开关时,扫描仪发出异常响声。这是因为有些型号的扫描仪有锁,其目的是为了锁紧镜组,防止运输中震动,因此在打开扫描仪电源开关前应先将锁打开。 2.扫描仪接电后没有任何反应。有些型号的扫描仪是节能型的,只有在进入扫描界面后灯管才会亮,一旦退出后会自动熄灭。 3.扫描时显示“没有找到扫描仪”。此现象有可能是由于先开主机,后开扫描仪所导致,可重新启动计算机或在设备管理中刷新即可,。 4.扫描仪的分辨率与打印机的分辨率是否是一个概念?应该怎样根据扫描仪的分辨率选购打印机? 扫描仪的分辨率的单位严格定义应当是ppi,而不是dpi。ppi是指每英寸的pixel数,对于扫描仪来说,每一pixel不是0或1这样简单的描述关系,而是24bit、 36bit或CMYK(1004)的描述。打印机的分辨率的dpi中的d是指英文中的dot,每一个dot没有深浅之分,只是0或1的概念,而对于扫描仪来说,1个pixel需要若干个4种dot(CMYK)来描述,即一点的色彩由不同的dot的疏密程度来决定。所以扫描仪的dpi与打印机的dpi概念不同。用1440dpi的打印机输出1:l的图像,扫描时用100-150dpi左右的扫描即可。 5.扫描仪在扫描时出现“硬盘空间不够或内存不足”的提示。首先,确认硬盘及内存是否够,若空间很大,请检查您设定的扫描分辨率是否太大造成文件数据量过大。 6. 扫描使噪音奇大。拆开机器盖子,找一些缝纫机油滴在卫生纸上将镜组两条轨道上的油垢擦净,再将缝纫机油滴在传动齿轮组及皮带两端的轴承上(注意油量适中),最后适当调整皮带的松紧。 7. 扫描时间过长。检查硬盘剩余容量,将硬盘空间最佳化,先删除无用的TMP文档,做Scandisk,再做Defrag或Speed Disk。请注意:如果最终实际扫描分辨率的设定,高于扫描仪的光学分辨率,则扫描速度会变慢,这是正常现象。 在扫描仪发展史上,文字识别软件(OCR)的出现,实现了将印刷文字扫描得到的图片转化为文本文字的功能,提供了一种全新的文字输入手段,大大提高了用户工作的效率,同时也为扫描仪的应用带来了进步。从此,扫描仪不再仅仅是图形、图像的输入工具,它真正的成为了电子化办公的有机组成部分。随之而来的是,扫描仪在金融、证券、政府等领域普遍应用,为人们摆脱纸制文档束缚,真正实现无纸化办公铺平了道路。 目前在中国市场上销售的每一款Microtek扫描仪产品,都附赠了“尚书六号”文字识别软件。在颇具美名的“尚书五号”文字识别软件基础上,“尚书六号”又有了许多新的突破。它一改以前文字识别软件只能对“黑白二色”图像进行识别的限制,可以对彩色、灰度图像文件直接进行识别;尚书六号支持更多的扫描文件格式,例如TIFF、BMP和JPG格式;与此同时,尚书六号完善了表格识别功能,各式各样的表格几乎都可以原封不动的由图片格式转变为可以自由编辑的文字格式。最值得一提的是,“尚书六号”还加入了人性化设计,在软件安装完毕后,程序组图标里面会自动出现“尚书六号说明”,借助这本用户手册,即使是初学者也可以迅速掌握软件的使用。 下面结合Microtek扫描仪的驱动软件ScanWizard 5,详细介绍如何配合尚书六号OCR软件做好文字识别工作: Step1:扫描图像文件 建议首先点击桌面上ScanWizard 5软件的图标,进入Microtek扫描仪驱动软件的界面,直接进行扫描工作,而不需要启动其他的扫描程序或图像编辑程序,这样可以大大加快扫描进程。同时,注意将ScanWizard 5软件切换到高级工作模式(如图1所示),以便于用户检查扫描仪工作时的分辨率。在文字识别时,推荐使用的扫描分辨率设定在300ppi,色彩模式可以选择“RGB彩色”或者“灰阶”,选择“扫描到”的文件格式是TIF或者JPG两者都可以,然后将扫描得到的文件保存在用户确定的目录下面。 Step2:打开尚书六号读取扫描好的图像文件 Step3:被识别图片的预处理 被识别图片的预处理工作主要包括“倾斜校正”和“设定正确识别区域”两个步骤。在进行“倾斜校正”时,可按下工具栏的最下面的一个“图像倾斜校正”工具按钮。系统会自动弹出一个对话框,提示需要校正的角度,此时按下“是”按钮,系统就给予图片做水平的倾斜校正。在此需要特别注意,“自动倾斜校正功能”只能对原稿做±2.8度的倾角的校正,如果原稿的倾斜角度大于2.8度,系统会建议用户重新扫描稿件,以提高识别率。 如何“正确设定识别区域”,也是一个值得用户注意的地方:如“海尔”一文,实际是分成两个栏目进行阅读的,所以在设定识别区域的时候,注意需要将这个两个栏目分别圈定,也就是设定两个识别区域(如图2所示)。同时,对于一些文字稿件,如果在中间插有图片的时候,建议采用绕开的方式,对所环绕的文字分别进行识别区域的设定。此外,对于表格类的图片,为了将标题栏也能识别进去,建议将表格部分整个框选,同时标题作为一个单独的框选区域。 Step4:开始进行识别 在开始“识别”的时候,应注意识别软件的设定值是否正确,尤其注意识别字集的选择问题:如果要识别简体中文,请选择“简体字集”;如果要识别繁体中文,请选择“繁体字集”;在选择“纯英文字集”时,可以大幅提升英文字母的识别率。同时,“简体字集”和“繁体字集”也具有较强的识别英文的能力。 Step5:识别校对完成后,进行保存 在“尚书六号”文字识别软件中,存盘格式(也就是文件保存的类型)有四种,分别是:Word、Text、CSV、HTML。直接用Word格式保存时,可以用微软的Word软件打开,它可以相对比较完整的保存排版格式;但建议用户一般可选择Text(纯文本)格式保存,因为这种格式可以用几乎所有文档编辑器打开;如果用户进行表格识别,识别结果可以选择保存为CSV格式,这样用EXCEL就能够直接打开;而HTML格式是针对网页设计使用的,用IE等网络浏览器或网页编辑器可以打开。 参考: