历史档案数字化加工解决方案
东软集团股份有限公司 1 项目建设内容 ................................................
2 历史档案数字化处理标准 .2011..................................... 年02月
2.1. ............................. 纸质档案数字化处理标准 2.2. ................................. 照片档案数字化标准 2.3. ................................. 声音档案数字化标准 2.4. ................................. 影像档案数字化标准 2.5. ................................. 实物档案数字化标准
3 数字化加工环节 ..............................................
3.1. ........................................... 档案接收 3.2. ....................... 标准的目录结构和文件夹的建立 3.3. ..................................... 建立目录数据库 3.4. ................................. 档案着录的工作细节 3.5. ........................................... 档案整理 3.6. ........................................... 档案扫描 3.7. ........................................... 图像处理 3.8. ............... 质检岗位:图像初检和复检(一检、二检) 3.9. ......................... 着录标记一稿双录、人机校验 3.10. .......................................... 数据挂接 3.11. .............. 数据成品信息准确性和完整性检查(终检) 3.12. .......................................... 光盘制作
3.13. .................................... 数据的硬盘备份 3.14. .................................... 现场测试和检验 3.15. ................................ 档案的文件目录打印 3.16. ...................................... 档案装订还原 3.17. .................................... 档案原件的还库
4. 服务成品 ....................................................
4.1. ................................... 成品数据技术参数 4.2. ........................................... 服务效果
5. 数据检验、验收和备份 ........................................
5.1. ........................................... 数据检验 5.2. ........................................... 验收审核 5.3. ........................................... 验收登记 5.4. ........................................... 数据备份
6. 电子数据质量标准 ............................................
6.1. ........................................... 图像顺序 6.2. ........................................... 图像质量 6.3. ......................................... 图像分辨率 6.4. ..................................... 图像与目录挂接 6.5. ............................................. 防病毒 6.6. ........................................... 存储格式 6.7. ........................................... 操作使用
7. 安全措施 ....................................................
7.1. ..................................... 数字化加工管理 7.2. ....................................... 档案安全管理 7.3. ................................. 设备及数据安全管理
1 项目建设内容
档案数字化是将纸质、缩微胶片、磁带等介质档案转换为电子介质(通常称之为电子扫描、录入)。本项目的建设内容主要是对档案进行数字化加工,建立档案图像数据;对档案的案卷目录和文件目录进行着录和校对,建立对应图像数据的案卷级和文件级目录数据库,并与档案图像数据建立对应的关系。同时对扫描出的图像进行OCR识别,以便实现全文检索。
本项目共分三部分:纸质档案的整理、条目数据库的建立、纸质档案数字化加工。
2 历史档案数字化处理标准
来源 载体或类型 纸质档案 原有记录形式 纸张 转换途径 扫描、数码相机拍摄 存储格式 Pdf、tiff、jpeg Pdf、tiff、jpeg Pdf、tiff、jpeg wav、mp3 mpeg、avi 传 统 档 案 照片档案 感光材料 扫描 胶片/幻灯 录音带 录像带 模拟信息 磁记录 磁记录 扫描 专用设备转换 专用设备转换 2.1. 纸质档案数字化处理标准
(1) 纸质文件扫描后的电子文件技术指标
纸质档案扫描采用黑白方式。
文件格式采用TIFF格式或者TIF格式。 文件扫描分辨率不低于300dpi. 电子文件大小应在25K/张左右
扫描文件及相应的数据库备份存储在硬盘及光盘中
(2) 文件名称要求:
案卷、文件的相关信息输入《档案管理信息系统》。案卷必须输入案卷题名,
案卷编号、归档号、归档日期、立卷日期、立卷人;文件必须输入文件名、文件编号、归档号、归档日期、主题词,对于长期和永久保存的档案文件,必须挂接相关的电子文件。
电子文件存储时按全宗、案卷分级建立文件夹存储,其中的每一份文件也需
要单独创建目录。 (3) 纸质档案文件拆分要求
标页码的准确率不低于95%;
页码字迹不影响原文档内容,尽量为小;
除装订线、订,在有利于扫描的同时,要保持原文档的完整性; 有相关《档案拆分记录》。
(4) 纸质档案文件装订要求
恢复文档原样,不漏页、错页;
装订案卷左下方对齐,两边成直角,三孔一线,装订线先拉紧; 有相关的《档案相关记录》;
按照文档内的卷内目录,校对目录,正确率达100%
(5) 纸质档案文件扫描要求
不多扫、漏扫,保证文档顺序准确; 文档字迹清晰可认,不能过浓或偏淡; 有相关的《档案扫描记录》。
(6) 纸质档案文件修图要求
文档清晰,无多余杂点; 保留原文档的字迹; 有相关的《档案修图记录》 保存方式为 年份一卷号。
(7) 纸质档案文件分件要求
按照卷内目录对扫描文件编号; 保存方式为卷号—文件号;
分件准确率不低于98%; 有相关的《档案分件记录》。
(8) 纸质档案文件录入要求
录入的正确率不低于97%; 记录条清晰,格式严谨; 有相关的《档案录入记录》。
(9) 纸质档案文件挂接要求
为扫描文件分发文件号,便于挂接; 保存方式为 年份—卷内—目录号; 有相关的《档案挂接记录》。
2.2. 照片档案数字化标准
(1) 前提条件:所有要进行数字化的档案必须先进行着录,编制好页号。 (2) 扫描方式:照片按全彩方式扫描。
(3) 分辨率:所使用扫描仪的光学分辨率必须大于或等于400dpi
(4) 扫描办法:对于所扫的照片,以常见5寸照片大小(12.5cm X 8.5cm)为参
数,统一采用400dpi分辨率,(主要考虑在网络浏览时其尺寸为最佳的观看效果,不须放大或缩小)对于其它大于或小于5寸的照片,其扫描线数可做相应的调整,但不得低于400dpi。例如:7寸以上的大照片,可选用300dpi;5寸以下的一寸照片,必须选用600dpi。若是2—3寸的黑白照片内,必须选用400dpi或450dpi。
(5) 文件存储类型:扫描后的照片以JPG格式存储,保存时必须选用图像选项的
品质为最佳值的(12)大文件,存入到统一的照片数据库。
(6) 文件存储方式:档案照片存储时按全宗、目录、相册分级建立文件夹保存,
照片名字以照片的档案号命名。
(7) 照片命名方法:每一张照片必须定义完全。包括此张照片的档案号、拍摄时
间、组说明或照片的定义内容。以上注明需在文件名中全部打出。
2.3. 声音档案数字化标准
(1) 存储标准:声音档案数字化时要选用标准和通用的格式。本项目规定的声音
文件存储为:WAV或MP3。
(2) 采样频率:声音档案数字化选用44.1KHZ作为声音采样的标准。对于DVD的
声音选用48KHZ。
2.4. 影像档案数字化标准
(1) 存储格式:影像档案数字化存储有两种标准。第一作为再利用的图像格式选
用MPEG2格式。第二作为可在网络上浏览查阅的图像格式选用MPEG4格式(常见文件名为ASF格、RM格式)。
(2) 数据传输率:作为DVD备份保存的影像档案数据传输率应在于6-8Mb/S。
2.5. 实物档案数字化标准
1 实物档案数字化要求
(1) 存储要求:数码相机所拍摄的实物档案存储在计算机中的格式为通用的图像
格式JPEG/JPG。经过处理后,文件保存时必须选用图像选项中的品质为最佳值的(12)大文件,格式仍为JPEG/JPG。
(2) 存储方式:实物档案照片存储时按实物的类别建立文件夹,对每一张实物照
片按档案号进行保存。
例:1995-JP-05 前面为此实物颁发的年度时间(1995),中间为实物的归类缩写编号(奖牌),后为此实物在该类别实物中的流水号(第五块)。
(3) 实物图片后期处理标准:对图片进行色、亮度的调整,对图片进行适当的边
框裁切。
2 电子文件接收 来源 产生途径 电 子 文 件 由各种办公自动化软件产生:包括文字处理软件、电子邮件、计算机辅助设计、网络出版工具等 由各种专业工具形成:包括一些数据类型 文本文件 图像文件 图形文件 音频文件 视频文件 数据库文件 格式 txt、doc、rtf、wps、pdf gif、jpeg、tiff、png、bmp cgm、dxf、dwg mpg/mpeg、avi、rm html、xml、sgml dbf、wks、db、dif 库、图形/图像处理软件、多媒体工具、音频视频工具、数码技术等 3 数字化加工环节
档案数字化加工流程主要包括档案接收、档案整理和修复、案卷目录/文件目录的一稿双录、目录建库、档案扫描、数据着录及校对、扫描校对、图像精细处理、图像质检、光盘制作、光盘灌库、挂库、批量挂接、挂接校对、数据备份及备份检查、档案恢复、质量监控和检验、安全管理、在线调档、报表打印、数据统计、档案归还、提交成果数据光盘等主要加工环节。
现对以上的数字化加工流程从流程控制方式、各环节的工作内容、遵循的质量标准、质量保证措施及技术组织实施等几方面进行进一步的描述。
3.1. 档案接收
将档案从档案库房的排、架上,按档案分类顺序填单、下架、清点、排列装入有编号的档案箱内,形成档案下架清单,清楚记录档案号和箱号。保证加工过程中档案不离箱,同时做到档案防水、防压、运输安全,减少档案的破损和丢失。
对接收的档案按分类形成其电子/纸质目录,根据需要清点到盒(卷),不出现漏登记或重复登记。由用户单位和加工方专人在出库移交清单上签字确认。
对下架接收的档案资料进行两人以上交叉核对、检查,与用户提供的电子/纸质的接收清单在加工方的生产加工管理软件档案接收模块中进行比对,如有错误之处立即核查更正,并打印出勘误表请用户方确认后再进行档案整理等工作。
加工方考虑到用户方提供的加工场地空间有限,采用定期分批接收,以便节省空间并可以保证加工现场加工工作的有序进行。
3.2. 标准的目录结构和文件夹的建立
按照用户所提供的案卷目录和文件目录数据库结构与着录要求,规范档案中的目录内容。包括档案目录的着录字段、字段长度和内容要求进行正确的着录和校对。
原则是以历史形成的档案整理顺序编排,并与档案实体保持一致。例如: 文书档案目录结构:年度+机构+资料分类+卷+件+页
照片档案和实物档案目录结构:以历史形成的档案整理顺序编排,并与档案实体保持一致
3.3. 建立目录数据库
主要建立案卷级目录数据库和文件级目录数据库,并通过专业技术把目录库与加工方进行档案数字化加工的档案加工管理系统关联起来,从而提高档案数字化的工作效率。
3.4. 档案着录的工作细节 3.4.1. 按原目录着录
按照国家档案局《档案着录规则》(DA/T18)和用户的要求(即上述案卷目录和文件级目录要求)进行着录,建立档案目录数据库。并将档案影像文件、档案条目信息、档案物理位置一一对应,形成方便管理查询的完整的电子档案。
3.4.2. 自拟目录着录
按照国家档案局《档案着录规则》(DA/T18)和用户的要求对无目录的档案进行分类、组件、组卷和拟定目录后再进行着录。
3.4.3. 目录数据质量检查
采用人工校对或软件自动校对(一稿双录,人机校验)的方式,对目录数据库的建库质量进行检查。核对着录项目是否完整、着录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
3.4.4. 一稿双录、人机校验
同一份档案的目录数据由两名不同的录入员分别录入,软件自动对两名不同的录入员的数据进行机器校验,当两者一致时跳过,若二者不一致时软件报警,并将这些项目标识出来(显红),且不让通过。软件提示:“数据不一致请确认”。随后进行人工校验,由校验员将软件标识出的不一致数据项目与档案原稿进行比对,将数据修改正确。
3.4.5. 数据库数据格式检验
按照国家档案局《档案着录规则》(DA/T18)等的要求,结合用户实际需求和相关规则,规范档案中的目录内容。包括确定档案目录的着录项、字段长度和内容要求。如有错误或不规范的案卷题名、
文件名(主题名、副题名)、文号、正文、底稿、草稿、批示页、印章页、责任者、相对页码(起止页号)和绝对页码(页数)等,应进行校对和修改。
3.4.6. 目录册的形成和打印
整理电子目录时,在电子文件夹和电子文件统一文件重命名后,形成按档案号统一命名的文件夹,同时形成档案的电子目录册(案卷目录、文件目录)。对形成档案的目录册(案卷目录、文件目录)和档案的全宗目录也可进行打印、排版、装订形成档案的纸制目录册。
3.5. 档案整理 3.5.1. 档案实体记录
加工方在整理时对档案进行排序、编页码、分件、拟标题和分类检查。在整理过程中同时记录档案的残、缺、漏、损页,并记录纸张的画幅大小和特性、档案的存储介质(照片、图表等)。导入用户方提供的档案电子目录,对照档案原件进行补充录入和校对,并打印出勘误表让用户签字确认。对照用户方提供的档案目录着录原件,对照档案原件的目录(手写/印刷体)进行分件、录入和校对,建立电子文档并保存,打印出勘误表让用户签字确认。
填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。 加工方在整理时对档案进行排序、编页码、分件、拟标题和分类检查。在整理过程中同时记录档案的编研特性和法律文书特性。对档案的存储介质(照片等)、领导批示页、印章页给予记录、分件和分类。
3.5.2. 档案修复(可视档案实际情况选择此项工作)
档案整理前要对破损严重的档案进行修复,档案修复的具体技术要求如下: 修复工作要求按照《档案修裱技术规范》(DA/T25-2000)进行操作
修复过程中需要拆卷的档案,要在确保档案原件安全的基础上,严格按照档案拆卷流程和技术要求进行,要求资料能够还原。应区分对待不同规格和不同纸质的档案。
平整档案应根据原件的具体情况进行锤平或压平,不得损坏档案,不得破坏数据记录。
档案的裁切要严格保持档案的原貌,不可将档案幅面裁小,更不能裁伤字迹。切口要求整齐。裁切短边,应一刀完成,裁切长边,可分数刀完成,但各刀口应联接平直,无接刀痕迹。整卷裁切的档案,要求刀口上下垂直,不得出现坡度。
档案的装订应视原件的具体情况进行线装、包背装或精装。装订必须在确保档案安全的前提下进行,不得遮挡任何记录。装订后的资料要求牢固、美观。
在档案修裱过程中,档案不能再次受损。要进行仔细地观察和分析研究,使裱糊的资料恢得在原来的部位上。
档案裱糊所采用的纸张和裱糊剂要求是安全的,同时要能确保档案的长期安全存放。
3.5.3. 扫描前整理
根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。 页面修整:破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
对于装订成册、不便拆装的档案做好档案的登记和记录,以便扫描时直接用加工方专业的不拆卷扫描仪直接扫描。计算机自动生成档案页码。
整理电子目录时,在电子文件夹和电子文件统一文件重命名后,形成按档案号统一命名的文件夹,同时形成档案的目录册(案卷目录、文件目录)、“00”册目录和档案的全宗目录。
在用户要求下,可以对形成档案的目录册(案卷目录、文件目录)、“00”册目录和档案的全宗目录进行打印、排版、装订形成档案的纸制目录册。
根据用户需要可以形成用户库存档案各种目录册的同时形成库存档案的财产帐和统计台帐。 通过档案加工管理软件,根据档案资料的整理和电子目录的建库形成电子文件夹和扫描任务单。
3.5.4. 档案整理过程中注意的细节
由编页码、档案拆分及标记、创建加工任务三部分组成。
1 档案排序、编页码
档案排序:根据用户单位的档案资料分类对档案进行排序的校验工作,核对档案的资料顺序和记录档案的物理状况(纸张状况、照片页、图表页),包括资料的缺、残、漏、损、重、页码混乱等状况,建立电子/纸质档案资料分类接收清单和出库登记本。
编页码原则:以卷为扫描最小文件夹单位,每卷按页编页码。即对每个需要扫描页以每卷文件为单位,页码都是从“1”开始,依次编码,页码写于每页文件的正面的右下角,反面的左下角。确保页码位置统一、整齐。此工序可保证加工中档案顺序一致,并方便质检人员质检图像及保证档案原件完整归还。每件文件的相对页码顺序在扫描后的看图详细着录中由计算机扫描系统自动给出。
2 档案拆分及标记
档案拆分原则:在数字化加工全流程中,为避免档案的错、乱、丢、毁,档案盒内的资料不离盒,不进行详细的拆分和组包。档案随盒、盒随工序进行数字化加工。每道加工工序结束后,将档案放回原盒原位,始终保持档案物理位置和逻辑位置的原版原貌。
对档案进行拆分整理,清除档案资料中的金属物,避免扫描时金属物损坏扫描仪。拆分后按原顺序放回盒内,保证分类档案不离盒,以免造成资料混乱。
3 创建加工任务
在加工软件的档案整理模块中系统自动调用在接收环节中录入的接收信息,整理人员只需将档案资料的分类情况输入到与其对应的档案记录中即可。软件自动生成扫描任务电子清单,并由专人审核后上传到服务器中的指定位置。扫描任务单主要内容是档案编号、调案时间、总页码、资料分类记录、整理人员名等。扫描任务单可以记录分配人、受分配人、分配时间及完成时间等项,确保任务与责任明确,保证及时有效的完成任务。
生成工作单:生成每日单班工作量,每个工作单不能跨盒跨件。 生成扫描任务单:根据档案不同纸张状况生成不同扫描仪的每日任务单。
3.6. 档案扫描
3.6.1. 档案扫描实施方法
档案经过整理人员整理完毕后,生成电子版扫描任务单分给扫描人员,即档案根据任务单扫描原则。工作人员首先需要输入“工号”和“密码”登陆到数字化加工系统的扫描模块,接收到扫描任务单。
登录:扫描人员进入数字化加工系统的扫描模块,输入“工号”和“密码”进入扫描操作状态,根据整理时标记出档案的具体情况,选择扫描仪及调整各项扫描参数。
【软件扫描界面】
打开软件生成的电子版扫描任务单,核对扫描档案的档案编号等信息,核对无误后开始对该档案进行扫描。
扫描时按照扫描页页码的顺序对档案资料进行扫描,为保证档案影像文件的扫描质量,根据扫描件实际情况选择黑白、灰度及彩色扫描方式,调整相关参数。
扫描形成的图像文件保存到服务器中,文件采用黑白、灰度或彩色扫描,分辨率采用300dqi,存储为Tiff或JPEG标准格式,压缩方式采用JPEG压缩格式或无损压缩(LZW)格式。
扫描完成的图像为单页TIFF/JPEG文件,文以目录数据库内该文件档号为据对扫描图像建立相应
文件夹,并对文件夹内图像文件按要求按档号/分类号进行命名。
3.6.2. 扫描仪的选择
扫描操作员对将整理好的档案资料,根据档案幅面的大小和纸张状况,选择相应扫描仪,具体对不同纸张档案扫描的处理工艺如下:
普通纸张:采用高速扫描仪进行连续高速扫描。
破损纸张:如一般破损,将破损纸张夹入透明塑料薄膜内,调整扫描仪进纸为厚纸模式并采用中、低速档进行扫描。如破损严重,且极不平整,则采用平板扫描仪完成。
字迹较浅(如铅笔字):如采用黑白二值扫描应调节扫描临界值(阈值),拉大字迹与原稿的反差。 装订成册档案:采用PS7000高速不拆卷黑白扫描仪,节省档案拆装时间,防止档案错乱。 灰度、彩色页:采用平板扫描仪,调整具体模板参数,保证扫描质量。
3.6.3. 扫描过程中的注意事项
不同年代、不同装订形式、不同技术要求的档案资料要采用不同型号的扫描仪和扫描工艺。例如:1985年以前的档案,灰度、彩色页档案,胶封、不易拆卷的档案,需采用平板扫描仪和不拆卷扫描仪。
使用扫描仪扫描图像时,应先进行试扫,调整扫描仪参数,以使扫描后的图像清晰,尽量无黑边。 工作时要小心谨慎,严禁撕毁、遗落或销毁档案资料,以及将档案资料带离现场。
逐页扫描时要仔细地核查档案页码,如发现存在漏编、错编页号的情况,需及时补编、改编页号。 遇到因扫描仪故障导致的纸张卡纸或撕纸,必须小心取出破损的纸张,将其粘贴复原。 一件资料扫描完成后,必须及时核对首尾页是否正确,扫描图像与原档是否一致;对图像出现的歪斜、黑边进行处理。
一批资料扫描结束后,必须核对该批资料中的扫描文件份数是否与档案资料的结果一致,如不一致,要仔细核对,找出原因及时更正。
较薄纸张(如信纸、便笺纸),应在纸张下加入白色打印纸作衬,调整扫描仪进纸为厚纸模式并采用中、低速档进行扫描;破损纸张,先进行修复再扫描。将修复后的纸张夹入透明塑料薄膜内,调整扫描仪进纸为厚纸模式并采用中、低速档进行扫描。对于原件破损严重的修复资料,则采用平板扫描仪完成。
底灰较深的纸张(如草浆纸、油印纸),如采用黑白二值扫描应将扫描对比度及亮度适当调低,如采用灰度扫描,也应注意适当调值。
字迹较浅的资料(如铅笔字),如采用黑白二值扫描应调节扫描临界值(阈值),拉大字迹与原稿的反差,效果不理想采用灰度扫描时也应注意调值。
如纸张幅面较长但幅宽不超过A3,可采用扫描仪长纸扫描功能,根据纸张状况设定合适的扫描幅长即可。如纸线幅宽超过A3,则采用宽幅扫描设备进行扫描,或者分区扫描后进行图像拼接,拼接成一个完整的图像。
扫描分辨率至少采用300DPI。若档案原件质量较差,应提高扫描分辨率,以使扫描资料能够满足计算机字符识别软件(OCR软件)智能识别的需要。
每扫描一页图像,保存成一个文件。灰度扫描保存为JPG文件或TIFF文件,以统一的保存格式为佳,电子文件的命名要求有明确统一的规则。
扫描文档的数量和存储顺序应与原档案资料的数量和顺序一致。
3.7. 图像处理 3.7.1. 基本概念
为确保每一幅扫描图像的清晰、不失真,采用自行研发的图像处理软件(ImageWorks)进行加工处理。对扫描后形成的图像通过计算机自动处理和人工处理进行逐页纠偏、去污、去黑边、扫描精度、对比度、亮度调节、影像的替换、插入、删除、图像拼接、裁边处理、统一版面大小、排列顺序调整,还可对图像进行字迹锐化、去除图像杂点、去除图像局部脏点等处理。应避免重张、倾斜、模糊等图像质量问题。
对扫描完的彩色和灰度图像运用加工方专业加工处理软件(ImageWorks)进行批量自动/单页手工的旋转、纠斜、剪边、去噪、线型弯曲校正、文字变形校正、中缝删除、影像居中等处理。
对于原档案有“红头”的,采用自行研发的图像处理软件(ImageWorks)进行加工局部套红技术,将影像中的“红头”还原为红色
3.7.2. 对劣质图像采用的处理工艺
对于不同的图像状况,分别采用如下方式进行图像处理: 局部减淡:采用字迹锐化的功能,清晰字迹笔画。 局部加粗:采用字迹填补功能,填补断线笔画。
去污去噪:采用图像去噪功能,去除图像杂点,具有局部清除功能,去除图像局部脏点、脏斑。
3.7.3. 图像处理中应注意的几点
图像偏度不得大于3度,以达到视觉上基本不感觉偏斜为准。
大幅面档案进行分区扫描的图像进行图像拼接,拼接处信息要完整,不能缺少任何信息,以保证图像的整体性。
对方向不正确的图像应时行旋转还原,以符合阅读习惯。
保证处理完成的图像页面中不出现影响图像质量的杂质如黑点、黑线、黑框、黑边等。 图像处理应遵循尽量展现档案原版原貌的原则。
3.8. 质检岗位:图像初检和复检(一检、二检) 3.8.1. 基本概念
质检岗位的专业质检员采用自行研发的Image QC质检管理软件对扫描完成后档案电子目录和图像进行逐盒逐件逐页的检查,并根据情况对图像进行质检校正、统计管理和生成返扫各种工作单。
质检管理软件可以对数字化加工管理流程中每个环节质量状况进行监督、统计、修改。产生的个别质量问题运用加工方Image QC图像质检管理软件进行批量自动/单页手工的旋转、纠斜、去黑边、剪边、居中、局部处理等全部图像加工手段,保证图像字迹清晰质量优秀。
采用自行研发ExamineFile软件对检查扫描图像数据信息的完整性。此软件主要功能:图像文件在局域网中传输时可能会出现数据丢包现象,此软件主要用来检查图像文件是否完整,确保图像信息完整性。
加工方明确的档案图像质检和保证索引正确性审核的详细措施,扫描流程必须经过一检、二检二次以上质量审核。扫描清晰度不得低于原件清晰度。扫描和补扫流程必须建立二次质检制度。扫描和补扫流程必须建立二次质检制度。
扫描加工采用看图着录技术、逐画幅进行图像处理,不采用批量图像处理软件,从而保证图像百分之百挂接正确率及百分之百图像合格率。
3.8.2. 质量检验要点
扫描资料的检查:按照扫描页登记页码的顺序对扫描所形成的影像文件进行检查,不能有漏扫、重扫或错序。
清晰度检查:影像文件的清晰度应最大限度地接近(等同于)扫描原件,扫描内容要完整,画面要端正,凡原件中可识别的内容(污迹除外),在影像文件的打印结果和屏幕显示结果中应亦可识别。
检查经过优化处理的影像是否符合要求。
为提高效率和防止加工混乱,电子文件夹(存储路径)的质检和返工全部在质检岗位上进行,不许其他岗位进行返工。
质检不合格的图像根据生成返扫工作单重新进行返工扫描,直至图像清晰质量优秀。在图像补扫后进行二检。
一检是在图像补扫前进行。
二检在图像补扫后,看图着录工序前进行。
3.9. 着录标记一稿双录、人机校验
同一份档案的目录数据由两名不同的录入员分别录入,软件自动对两名不同的录入员的数据进行机器校验,当两者一致时跳过,若二者不一致时软件报警,并将这些项目标识出来(显红),且不让通过。软件提示:“数据不一致请确认”。随后进行人工校验,由校验员将软件标识出的不一致数据项目与档案原稿进行比对,将数据修改正确。软件优点为:
通过“一稿双录、人机校验、看图着录”,可以大大避免电子图像和目录着录过程中的人为误读、误录、漏录和挂接中误挂漏挂等错误,双份数据的机器比对可迅速标识出可能发生错误的录入项目,可大大提高校对速度和效率。
不同种类的文件,自动设计或套用相关的元数据模型,记录和维护元数据各种元数据,并提供这些元数据作为文件检索的入口。电子文件提供利用时,保证其权限范围内的文件信息和元数据信息都能够提供利用。
3.10. 数据挂接 3.10.1. 汇总挂接
档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过我公司软件程序,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。
3.10.2. 数据关联
以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该
份文件的档号是否相同,图像文件的页数与档案目录数据库中的该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理,扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。
3.11. 数据成品信息准确性和完整性检查(终检) 3.11.1. 图像数据信息完整性检查
采用自行研发ExamineFile软件对检查扫描图像数据信息的完整性。此软件主要功能:图像文件在局域网中传输时可能会出现数据丢包现象,此软件主要用来检查图像文件是否完整,确保图像信息完整性。
3.11.2. 目录数据信息准确性检查
首先为保证案卷目录及文件目录条目录入的正确性、完整性,其次,为保证目录及文件图像挂接的正确性、完整性。对目录和图像实行“一稿双录、人机校验”的数据录入校验模式。
3.11.3. 图像挂接准确性检查
档案数字化加工QC系统通过盒与件之间的唯一关系使两者紧密联系。在系统的浏览界面里每点击一盒就能调出该盒的相应的文件目录信息,通过点击文件目录还可以看到该件所挂接的图像文件。在浏览界面的状态条上我们还能看到对该盒目录数据与图像数据比对的情况,当两者一致时正常状态,若两者比对不一致时系统立即反红显示,即报错。在这种情况下我们就要根据显示的不同情况去查原件或找原因,直到两者一致为止。对于报错的数据可以点击右键将该盒/件的信息添加到修改意见表里,待检测完毕后统一打印报表。
3.11.4. 数据成品(图像和目录数据信息)完整性检查
采用自行研发ExamineFile软件对检查扫描图像数据和目录数据信息的完整性。此软件主要功能:图像文件和目录数据文件在局域网中传输时可能会出现数据丢包现象,此软件主要用来检查图像文件是否完整和目录数据信息是否匹配,确保图像信息和目录信息的完整性。
3.11.5. 生成检验日志报告
每道工序、每个岗位、每个文件形成的检验报告由软件自动生成。
3.12. 光盘制作
以目录数据库内该文件档号对扫描图像建立文件夹,并对文件夹内图像文件以八位数顺序号进行命名(命名标准用户单位另附)。数据光盘内文件电子影像存储格式为单页TIFF格式。扫描后的电子文件需要提交DVD光盘(计算机只读光盘)和移动硬盘。前者用于保存和查询,后者用于数据整体转移。
3.12.1. 光盘数据组包
光盘制作软件自动分盘、打包、统计及生成索引项目录、档案电子影像目录和光盘目录并能够打印。光盘打包原则:
软件根据操作人员输入的信息进行自动分盘、打包。电子图像不跨盒不跨件。 软件自动生成光盘索引目录和光盘卷标,并能够提供打印模板。 光盘索引目录是将档案编号、光盘号、硬盘号和档案影像“一一对应”。
在档案管理软件系统中,光盘刻录模块应预留光盘号备份字段,保证用户单位数据升级后可以继续补充到相应的位置。
3.12.2. 光盘刻录和光盘质检
1 对光盘介质的要求
要求制作的数据光盘采用正版品牌、单片包装盒盘片。盘盒包装应有相应光盘目录。 DVD-R/CD-R介质,应采用正品盒装SONY、Maxell(万盛)、vERBATIM(威宝)等知名品牌。
2 对光盘刻录时的要求
为了保证光盘质量,数据加工方使用新刻录机进行光盘刻录。禁止使用工作时间较长、激光头功率不足的刻录机进行刻录。
DVD-R光盘,刻录速度应不超过8速;CD-R光盘,刻录速度应不超过24速。
刻录光盘时加工方采用整盘刻录(disk-at-once recording)方式,不使用多段刻录(multisession recording)等方式。(使用的刻录软件为:WINONCD3.8以上版本)
对于4.7GB的DVD-R,刻录内容不应超过4.3GB;对于700MB的CD-R,刻录内容不应超过6501MB。一卷档案的影像文件必须存放在同一张光盘上,不允许分拆。
为避免长期存储造成数据意外丢失,数据加工方提供的原始光盘介质应一式两份。 光盘制作成档案数据目录和影像存储格式为单页TIFF的数据光盘。
同一张光盘上的编目信息应与影像文件完全对应,出现任何不一致均需返工。 专人专岗从事光盘刻录和光盘质检。
光盘刻录和光盘质检前要经过用户的质检、签字确认和监督刻盘。 光盘刻录前要备份光盘刻录软件。
通过加工方的光盘质检软件比对光盘数据与硬盘数据,以确保资料无遗漏及正确性。每张光盘的组包信息与计算机硬盘中的成品组包信息一一对应,当光盘出现问题(图像丢、损、打不开等现象)可使用硬盘还原重新刻录。
在数字化加工管理软件中,光盘的制作过程将所有光盘编号、光盘内档案的分类信息和目录信息、所对应的档案文件目录和档案文件目录以及全宗目录及质检信息用专用的光盘质检报表进行统计管理。
每张光盘包含说明文件,文件名:README;文件内容:有关本存储载体的各种信息(含归档年度、盘号、制作人、检查人、制作时间、文件格式、字符文件等)。 光盘盘号编码:由用户提供光盘编码标准。
3.12.3. 光盘备份
将加工完成并在多台计算机上检查合格的成品数据刻录到数据光盘(DVD/CD)中,一式两份,并保证光盘读取正确,并可以检索、打印。同时在每片光盘包装盒内及盘片上附光盘标签和光盘目录,标明光盘编号、档案的分类信息和目录信息以及所对应的硬盘编号。
3.12.4. 打印光盘目录、光盘标签
软件能够按用户要求根据分盘时生成的索引项打印出光盘编号与档案编号对应的光盘标签。光盘索引文件还包含有关本张光盘的各种信息,包括光盘参数、光盘编号、档案类型、文件数量、文件范围、光盘制作单位、制作软件、光盘一致性检查单位、阅读软件以及软件硬件支持环境、制作时间等。
3.12.5. 光盘恢复
硬盘数据备份系统可以将发布到光盘上的档案分类结构、档案目录和电子原文恢复到档案综合管理系统中,作为数据恢复的一种方法,有效保证数据的安全性、完整性。
3.13. 数据的硬盘备份
将光盘组包后的成品数据采取活动硬盘的存储形式进行备份,硬盘所备份数据与光盘所存储的数据保持一致,方便用于数据的整体转移。
加工方保证硬盘数据备份与光盘数据是一一对应的,光盘如出现问题,可用硬盘还原光盘重新刻录。
3.14. 现场测试和检验
用户单位可以在全部工序中随机抽检,加工流程培训软件可逐页定位随时抽检,检验时我们同时提供现场抽检的日志文件(CSV、MDB格式)可导入用户单位相应的质量检测系统(QC系统)
3.15. 档案的文件目录打印
对于拆开扫描的档案,在加工完成后将档案进行最终的排序、校验,校验后对所有的档案目录进行排版和打印(所有目录打印应留出装订线),并装订到案卷最前面。如有变更和勘误应在备考表上注明。同时,软件自动形成全宗目录、文件目录、文件目录的同时要提供每件文件的相对页码和绝对页码。
3.16. 档案装订还原 3.16.1. 概述
拆除过装订物的档案应按原档案保管单位重新装订,并保持每页档案原有的排列顺序不变,案卷不掉页、右边和底边整齐。
根据工作单对照档案接收整理时原目录清单核对顺序、数量整理对齐后再进行装订。装订时要求比照原装订孔及装订样式,做到原接原退。如有装订不合格档案将按照规范重新装订。
3.16.2. 案卷装订工作细则
1 装订要求
案卷通常使用线绳按三点一线方式装订,装订要结实、整齐、不掉页、不倒页、不压字、不损坏文件、不妨碍阅读。
大张图纸应先折叠,后装订。
2 装订方法
案卷码放:
将案卷文件从卷皮中取出码放整齐,顺序由上至下为:案卷封面、卷内目录、档案文件、备考表、案卷封底。
案卷沿左齐、下齐方向码放整齐后,将案卷顶端、下端用夹子固定。 打孔:
按照案卷封面上的装订孔位置用三针装订机打孔。 穿线:
截取50厘米棉线并对折,用钩锥将棉线中端从案卷封面中间孔,由案卷正面穿到案卷背面形成线环,再将棉线两端从案卷其余两孔穿到案卷背面,将案卷背面向上,将线绳两端交叉穿过中间的线孔后,用力向两边拉紧线头,系死扣两次后整理线头,线头长度一般不能超过3厘米。
长页面折叠:
案卷装订后,对长页面进行折叠,方向顺应文件原折叠方向,折叠后纸张宽度与本卷文件宽度保持一致,如果折叠一次后纸张仍然超宽,可再次折叠。页数超过10页的文件需分批折叠,每批限量5张。
大图折叠:
大张图纸需折叠成为16开幅面,装订位置为图纸的左上角。 叠图顺序为:
先由下向上、由外向里折叠,将文件纸叠为16开高度,多出部分按此
高度反复折叠成“风琴”状;
再由左向右折叠,折叠后文件宽度为16开,如仍然有多出部分,则左
边留出25毫米装订边后,由左向右折叠,如此反复折叠成“风琴”状。
3.16.3. 案卷装盒细则
以年度为单位从1开始编卷盒流水号,用铅笔将流水号标于卷盒顶面。 将装订完成的案卷按照各卷封面上标注的盒号装订入相应的卷盒,装盒时
按照卷号顺序排列,小号在上,大号在下。
案卷装盒后,将卷盒按流水号顺序依次排列。
3.17. 档案原件的还库
将加工完成的档案分期分批的进行移交,移交时应提供书面/电子的交接清
单。
交接清单上除有档案出库时所有交接项目外,应包括提供新生成的数据光
盘、目录光盘和相应的光盘编号。按照用户单位要求提供所有档案资料的书面和电子的文件目录、文件目录。
由加工方专人与用户单位指定专人进行交接,交接清点完毕后,双方在质
检验收清单、加工数量统计清单上签字确认,同时双方在档案资料入库清单上签字确认,完成交接验收工作。
4. 服务成品
4.1. 成品数据技术参数
扫描方式:黑白、灰度或彩色 规格: Tiff、Jpg或PDF 扫描图像 分辨率:300dpi或以上 压缩方式:JPG格式或无损压缩(LZW)格式 案卷索引 声像档案 光盘内为Microsoft Access数据库 音频规格:*.MP3格式 视频格式MPEG-2格式 纸质档案的数字化,确保符合《纸质档案数字化技术规范》国家档案行业标准DA/T31-2005。
4.2. 服务效果
通过对档案数字化加工,加工方最终的服务成品数据是将档案目录和档案图像集成为一个完整的可浏览、检索的光盘单盘调阅系统。
加工方扫描完成后,用户首先可以得到上述各种数据成品;并且可以通过光盘调阅程序对加工完成的任意档案图像和数据进行调阅检索,可以进行档案图像打印还原等一系列应用。同时可将加工后的成果导入档案管理系统,实现用户档案资料的在线查询和归档查询等服务。
通过数字化加工将用户档案资料在符合国家档案局各项标准的基础上对档案进行信息化处理,最终将光盘图像数据和目录数据挂接到现有用户档案管理系统中,实现原有纸质档案资料的数字化、电子档案的网上查询利用。
5. 数据检验、验收和备份
5.1. 数据检验
1. 首先成立验收小组,验收小组成员由用户单位组织相关人员,加工方指定专人
协助验收。
2. 数据检验以数据抽检的方式进行,检查要覆盖所有已完成数字化转换的数据,
包括目录数据库、图像文件及数据挂接的总体质量。 3. 数据验收进抽检的比率不得低于5%。
4. 目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、
不清晰、有错误等质量问题,抽检标记为“不合格”。档案数字化转换质量抽检的合格率达到98%以上(含98%)时,给予验收“通过”。 5. 合格率换算公式:合格率=抽检合格的文件数/抽检文件总数×100%
5.2. 验收审核
验收“通过”的结论,经用户单位分管领导审核、加工方单位负责人双签字后有效。
5.3. 验收登记
认真填写纸质档案数字化验收登记表单。
5.4. 数据备份
将经验收合格的完整数据进行备份,数据一式三份。一份留存服务器中供
查档利用检索,同时保留一份存储于磁带库中,一份为中标公司刻录光盘(DVD_ROM/CD_ROM)。
任何一份备份完成的数据都应进行数据检验。 备份数据的检验内容主要包括备份数据能否打开; 数据信息是否完整; 文件数量是否准确等。
数据备份后形成的光盘应在相应的备份介质上做好标签,以便查找和管理。 库房管理员处应进行备份登记,填写纸质档案数字化备份管理登记表单。
6. 电子数据质量标准
6.1. 图像顺序
保证电子图像顺序与原档案中页码顺序一致,不可颠倒、错乱。
6.2. 图像质量
必须保证电子图像完整无缺、清晰、不失真,不增添污浊,不留文字版面外
的暗影,无干扰信息,黑白对比度适中、页面端正,无图形扭曲现象。
6.3. 图像分辨率
对档案页面字迹清晰、不带插图的档案,采用黑白二值模式进行扫描;对档案页面字迹清晰度差或带有插图的档案,采用灰度或彩色模式扫描,分辨率为200dpi。对文字偏小、密集、清晰度较差等情况,分辨率为300dpi或更高。黑白二值模式扫描的图像文件,采用TIFF(G4-2D)格式存储,灰度和彩色模式扫描的图像文件,采用JPEG格式存储。
6.4. 图像与目录挂接
图像文件与目录数据、图像顺序与档案页码顺序的挂接正确率为100%。
6.5. 防病毒
采取web网络隔离和病毒防火墙等防病毒措施保证所有电子档案文件不含病毒。
6.6. 存储格式
提交的电子图像档案均为黑白单页TIFF G4格式、彩页或灰度JPG格式的影像文件。
6.7. 操作使用
导入到客户档案管理系统中的档案目录数据、电子图像和光盘必须达到顺畅使用要求。
7. 安全措施
扫描工作中的安全要求加工公司是专门从事涉密档案数字化加工工作和档案
数字化集成工作的。我们从数字化加工管理、档案安全管理、设备及数据安全管理等各方面制定了严格的规章制度。
7.1. 数字化加工管理 7.1.1. 工作人员管理
工作人员必须通过政审面试、操作考试合格,同时证件齐全(含:本人身份证、家庭成员的户口本复印件、当地派出所的证明、无犯罪记录、个人简历及相关证件)双方签订保密协议。将相关证件及保密协议交由档案馆进行二次审核。工作人员由加工公司管理层(经验丰富的项目经理)进行统一的上岗培训,具备档案数字化加工的相关知识。加工公司具有省级以上的资质。
7.1.2. 工作区域管理
工作人员在工作时间内不准会客,不到非工作场所,保持工作区域的安静,进出工作区域时需要两人以上行动。在工作间不允许抽烟、吃零食、大声喧哗及做其它可能损坏档案的事情。
7.1.3. 实际操作管理
工作人员不能无故察看和互相议论档案内容。工作时统一穿戴无口袋的工作服,出入工作室不得携带任何与工作相关的物品;工作过程中产生的碎纸、废光盘等工作垃圾不得私自处理,必须交由档案馆值班人员统一处理。挂包、钱包等个人物品存放在指定位置,未经省馆管理人员同意,不得将工作间任何物品带出
工作间外。
7.1.4. 通讯及存储设备
现场工作人员不得携带任何手机、呼机等移动通讯设备以及软驱、移动硬盘、U盘等信息存储等设备。
7.1.5. 工作日志管理
每位现场工作人员必须有每天的工作记录(时间、地点、数量等),并进行定期检查。
7.1.6. 出入证使用管理
工作人员工作场所的出入证件由专人管理,进入工作场所由证件管理者确认后当场发放,离开时交回。
7.1.7. 请销假制度管理
工作人员一律由主管人员负责把关,严格请销假制度,不得中途离职或无故不上班,实行奖惩制度。
7.2. 档案安全管理 7.2.1. 档案交接管理
档案交接由档案馆专门人员和现场加工负责人员,在安排好的工作间里进行面对面的交接,要求有书面交接记录,流程中由档案馆专门人员全程监督并有书面交接记录。
7.2.2. 原档案保护措施
对档案原件要小心存放,对拆订后的档案原件装订后要恢复原样。现场工作人员要保证档案的完整,不得损坏和丢失,不得篡改档案内容,原档案磨损、不清晰的,需档案馆专门人员签字同意,方可进行下道工序。
7.2.3. 档案安全存放
档案只能在工作间的专用保险柜内存放,工作间内的其它地方不准存放档案。
7.2.4. 档操作安全管理
工作人员下班时,均应将工作间中所有档案锁在专用保险柜中,由加工方相关责任人保管好钥匙,并由档案馆人员锁好工作间房门,实行双重保险。
7.2.5. 防火安全管理
工作人员加强防火安全教育、工作间内严禁吸烟和任何火源。防止无关人员进出,防火设施配置齐全。
7.3. 设备及数据安全管理 7.3.1. 设备网络安全管理
扫描现场的计算机及其它设备不能以任何方式连接因特网,严防数据泄密。对计算机采取专用安全性高的屏蔽网线及安全专用水晶头,交换机设施进行物理性二次屏蔽。所有设备外壳均接地线以达到信息数据全屏蔽效果。
7.3.2. 计算机存储安全管理
数字化加工工作的计算机存储设备(包括软驱、硬盘、MO驱动器、活动硬盘等)
必须格式化和封闭所有计算机存储设备外围接口,统一管理加工现场的打印机、打印纸、光盘、软盘及其它存储打印设备。
7.3.3. 监控设备安全管理
在数据加工现场进行不间断录像监控,随时提供客户检查。
7.3.4. 数据存储安全管理
加工产生的数据,均需存入档案馆指定存储器,不得留取任何备份。加工过程中使用软驱、光驱设备必需是档案馆有关人员参与使用。
7.3.5. 备份数据安全管理
在备份数据的计算机上设密码,每位操作员设置独立的开机密码,防止数据泄密。
7.3.6. 数据质量安全管理
每道工序都要有明确的质量规定,对工作人员有具体的奖惩条例,并有专门的质检组负责多次的校对和质量检验,确保工作的质量标准和安全保密。所有工序都必须接受档案馆专门人员的监督和检查。
因篇幅问题不能全部显示,请点此查看更多更全内容