分布式资源采集系统
分布式资源采集系统是东软在大数据环境下,为满足海量数字资源搜集的要求而倾力打造的一款具有革命性架构设计的产品。系统面向不同数据类型,如日志文件、音频、视频、图片,网络资源,社会化数据,提供不同的采集配置,充分满足大数据时代客户对多样化数据类型搜集的需求,针对不同数据级别的存储可灵活选择合适的存储方案。采用高可扩展性架构设计,完美支持新类型数据来源的采集及新类型的数据存储,为客户量身定制海量数字资源采集服务。

全面
大数据环境下,数据类型早已不再单一,包括以文本为主的结构化数据,网络日志、音频、视频、图片等等多类型的数据,同时还包括机器数据、社会化数据,面对这些多样性的数据来源,系统从采集、处理、存储整个流程提供全面的解决策略,包括不同类型数据源采集配置、多种数据存储方案、不同数据量级的采集任务。

大数据
企业数据随着大数据时代的到来,越来越多以非结构化数据的形式存在,未来可能会产生更多的数据类型,数据量也在不断剧增。针对多类型数据来源、不同数据量级的特点,以组件方式提供灵活的数字资源采集方案;基于弹性扩展架构实现海量PB级数据的高性能存储。基于分布式技术实现亿级数据的高性能采集。

扩展性
为了保障未来业务增长对采集扩展的新需求,以组件化的方式支持新类型数据源采集扩展、新类型存储方式的存储扩展;以分布式技术支持采集规模的扩展,提供可定制的采集服务,同时能够满足业务随需而变。