DocsCorp contentCrawler
contentCrawler for Bulk Image Conversion
contentCrawler是一个综合的分析、处理和报告框架,可以智能地评估文档管理系统中的大量处理文档。
用户可以使用OCR或Compression模块批量处理内容存储库中的文档。或者,这两个他们都可以使用。例如,contentCrawler会将DMS中的所有基于图像的文档转换为文本可搜索的PDF。然后,Compression模块将对所有PDF应用压缩和缩减取样,减小文件大小。
自动化的端对端流程可以全天候运行,无需任何员工干预,定期向IT Administrator发送处理统计信息和错误报告的通知。员工不再需要担心OCR或Compression作为一个过程或工作流程。
contentCrawler包括本地和云端两种解决方案。
主要特征
评估和分析OCR和/或压缩处理的内容存储库中的文档
处理基于图像的文档,如TIF,JPG,PNG和图像PDF
将基于图像的文档转换为文本可搜索PDF,添加文本图层以进行增强搜索
使用各种JPEG压缩标准减小基于图像的文档文件大小
在电子邮件中处理基于图像的附件
设置压缩和文本阈值以优化处理,忽略不符合要求的文档
集成
contentCrawler与许多领先的文档管理系统以及Windows文件系统集成:
File System
HP TRIM/Records Manager
iManage Work
MS SharePoint
MS SharePoint Online (O365)
NetDocuments
OpenText Content Server
OpenText eDOCS DM
OpenText LiveLink
ProLaw
Worldox
系统要求
操作系统
Microsoft® Windows Server® 2016, 2012 R2 or 2012*, 2008 R2 SP1* or 2008 SP2*
MS .NET Framework 4.5/4.5.1
* 不支持 Server Core Role
硬件
8 GB RAM
100 GB 可用磁盘空间
1-2 GB 每个CPU 内核超过4*
* 建议: 4 个专用CPU
contentCrawler 支持多核CPU —— 4, 8, 16 及 32 核.
contentCrawler 优势
每个人每年在寻找丢失或隐藏的文件上可以节省长达240小时的生产力。
contentCrawler可以在4,8,16或32个CPU内核上运行,以加快处理速度。
contentCrawler比您的文档管理搜索技术多找出30%的文档
每人每年可节省120小时OCR的文档
全天候运行全自动OCR处理,无需工作人员干预
OCR每天最多可高达17000页