倒版书为什么会有那么多错字它直接复印不就行了吗?
它直接复印不就行了吗?
凡盗版图书,其制作过程大都如下: 买来要盗版的正版书,拆开来逐页放进扫描仪中进行扫描。书中的文字先是以图片文件的形式存入,然后经OCR光学字符识别软件对图片中的文字进行识别和转换,形成可以编辑和排版的文本文件,然后排版印刷。 盗版图书的这一常规制作过程注定了盗版图书必然会存在大量错字、别字、漏字、缺页和错误内容,因为目前世界上还没有一种文字扫描技术能够做到100%正确地将文字扫描进电脑一点错误不出(例如对纸页上较淡的笔画、污迹、污点等无法正确识别与处理),也没有一种OCR软件能够100%地正确识别扫描出来的图片中的文字与符号,将其一个不错地转变为可编辑排版的文字字符(尤其是对医学书, OCR软件的字库里本来就没有那么多偏僻少见但数量可观的医学专业名词和符号,自然也就不可能将其准确地识别出来)。也就是说,在盗版书的制作过程中,源于扫描仪和OCR软件的天生缺陷而产生大量文字符号差错成为必然。 正规出版社在书稿进行付印前,都会动用专业加工编辑对书稿进行至少三遍的逐字逐句检查和校对,以修正文字符号等方面的差错。而制作盗版图书的人是不会花时间和人力进行如此认真的检查和校对的,往往是扫描完成后直接就投入印刷,或只是简单地检查一遍通过扫描正版书所形成的盗版书稿,遇到扫描、OCR转换等环节上形成的缺字、错字和错句,由于无法向原作者询问,只能随便填写上一些内容,或作大段的删除。这就是为什么媒体上经常报道盗版图书中“罕菜(一种中药,专门治疗咽炎)治疗咽喉病”印成“蔬菜治疗咽喉病”,“豆腐500克”印成“豆腐00克”,“四五十天”印成“凹五十又”,“近半年”印成“近牛午”,“随着二氧化碳的产生”印成“虽着O2气的产生”,标点符号错误司空见惯,病句、错句、看不懂的句子屡见不鲜。 熟悉盗版书的人都知道这么一个现象:正版书与盗版书的全书页数和厚度常常大不一样。越便宜的盗版书,页数越少,厚度越小,缺的内容越多。其原因一是盗版书用纸爱选最薄最便宜的,二是盗版者为了压低成本,故意去除书中的部分内容,减少页数,只管卖给你一本书名相同、外观一样、价格便宜的盗版书,才不管这本书内容是否齐全、质量是好是坏。很多买盗版书的人在买书时是看不出所买的书是否内容齐全。即使能够看出,若追究,他们会说:盗版书就这样,谁叫你想图便宜!想买质量好的书,多花钱去买正版啊!目前很多销售盗版书的人都不隐讳盗版书的内容、质量不如正版这一点。 除了文字、符号方面的问题外,盗版书中的图片质量也明显比不上正版。制作盗版书时,要对正版书中的图片尤其是照片进行再次的照相翻拍。翻拍形成的底片颗粒必然增大,图案色彩、层次、明暗度等必然大不如原版,图片质量很差,清晰度下降。