数盈数据资源管理平台
东软数盈数据资源管理平台专注数据领域,是集数据规划、采集、治理、应用及资产管理于一体的全生命周期处理工具。通过数仓规划、数据标准、数据模型及数据指标管理为数据管理绘制清晰蓝图,避免资源浪费,促进数据与业务深度融合,提升数据管理效能与决策支撑力。借助离线数据采集和实时数据采集,从各类异构数据源中精准、完整且及时地汇聚原始数据,形成全域数据中心,为下游数据应用提供全面、真实的数据支撑。通过数据质量分析、比对、安全管理,构建完善的数据治理体系,全方位管控数据质量、数据安全,提升数据可用性与可靠性。借助离线开发、实时开发及标签开发,从海量数据中萃取精华,为业务创新与决策科学化注入强大动力。通过服务注册、发布、编排、统一管控,让数据安全、高效的流通起来,加速业务流程,增进跨部门协作,拓展数据应用边界。借助数据资产、数据血缘、关联关系与自助查询,让数据触手可及,提升数据战略地位,挖掘数据经济价值,为组织创造多元收益与竞争优势。

主要功能
管理中心
管理中心是平台的核心管控中枢,承担着平台全局资源调配、权限管理及数据源统筹的关键职能。该模块为平台管理员、租户管理员、项目级操作人员提供分层级的管理能力,可实现从系统基础配置、全局消息协同到多类型数据源纳管的全流程管控,同时支撑跨工作空间的任务资产沉淀与项目上下线管理,为平台稳定运行和高效协作提供基础管理能力。
运维中心
运维中心是平台的 “运行指挥中枢”,聚焦于平台全域任务调度、运维状态监控及数据流转跟踪,通过统一调度引擎、多维度监控大盘和智能预警机制,实现对数据采集、治理、服务等全链路任务的可视化管控。该模块可实时反馈任务运行状态、精准识别异常风险、追溯调度日志详情,为运维人员提供高效的问题定位与应急处置能力,保障平台业务的连续性与稳定性。
数据标准
数据标准模块是实现数据规范化管理的核心组件,承担着统一数据定义、规范数据属性、保障数据一致性的关键职责。该模块可实现从标准模板定制、参考数据维护、数据元与数据集管理,到落标检查、值域对照的全流程数据标准管控,既能为数据规划、数据治理等上游环节提供统一的数据规范依据,也能为下游数据开发、数据应用等业务输出高质量、标准化的数据资源,帮助用户消除数据孤岛、提升数据资产的可用性与可信度。
数据模型
数据模型模块是平台实现数据资产结构化、规范化管理的核心建模工具,为数据仓库构建与业务数据治理提供全流程模型设计、管理与落地能力。该模块深度整合数仓分层管控、多类型模型设计、可视化关系展示及模型物化落地等核心能力,既支持贴源层、明细层、服务层等数仓全层级数据的统一分类管理,也可完成关系模型、维度数据模型的全生命周期管控,同时能实现模型 ER 图自动生成与跨数据库物化建表,为下游数据开发、数据应用等业务提供标准化、可复用的结构化数据模型支撑,帮助用户搭建统一的数据模型体系,夯实数据资产化管理的核心基础。
离线采集
离线采集模块是实现多源异构数据批量汇聚与预处理的核心组件,主要面向非实时性业务数据的采集与加工需求,为下游数据治理、开发及应用提供标准化的基础数据。该模块支持图形化拖拽式任务配置,集成 AI 辅助采集能力,提供全量、增量等多种数据抽取策略及 50 余种数据转换清洗组件,可实现从关系型数据库、文件存储、大数据平台等多类型数据源的批量数据接入,同时支持自定义转换逻辑和灵活的错误处理机制,还能完成文件的增量传输与断点续传,满足复杂业务场景下的离线数据同步与预处理需求,为全域数据中心的构建筑牢数据接入根基。
实时采集
实时采集模块是实现业务系统数据秒级同步的核心组件,主要面向高时效性业务数据的采集需求,为实时数据分析、业务监控等场景提供精准、及时的数据源支撑。该模块支持 Web 端批量配置同步任务,可实现Oracle、MySQL、SQLServer、PostgreSQL类型数据库变更数据的实时捕捉,支持字段自定义常量配置与数据增删改轨迹同步,还能自动适配 MySQL 表结构变更,同时提供可视化的任务运行监控能力,可实时追踪同步延迟与数据操作量,帮助用户构建低延迟、高可靠的实时数据链路,夯实实时数据应用的基础。
数据比对
数据比对模块是平台保障数据一致性与准确性的核心校验工具,为数据流转全链路提供多场景、高精度的数据差异识别与验证能力。该模块支持跨数据源的批量数据比对,可灵活配置比对规则与维度,能够生成可视化比对报告与差异明细。无论是数据迁移后的一致性核验、数仓分层数据的准确性校验,还是跨系统数据同步的结果验证,该模块都能提供高效、可靠的比对支撑,帮助运维与数据治理人员快速定位数据问题,保障数据资产的可信度与可用性。
数据质量
数据质量模块是保障数据可信度与可用性的核心治理组件,为数据全生命周期提供多维度、全流程的质量校验与问题整改能力。该模块通过构建覆盖列级、表级、表间及 SQL 规则的校验体系,内置多种行业通用质检规则,支持跨库跨表复杂场景的质量核查,同时提供质量监控大盘、问题数据分配、多格式报告生成等能力,可实现数据质量问题的精准识别、追溯与整改,为下游数据开发、数据应用及数据资产化运营筑牢高质量数据根基。
元数据管理
元数据管理模块是实现元数据全生命周期管控与数据血缘追溯的核心工具,为数据治理和数据应用提供透明化的元数据管理能力。该模块支持多类型元模型自定义与管理,可自动采集全域库表元数据并实现变更通知,同时能构建可视化的数据血缘关系(含列级血缘),还提供元数据自助查询与表结构变更记录能力,帮助用户清晰掌握数据资产的分布、流转及变更情况,为数据溯源、影响分析和合规审计筑牢基础。
数据安全
数据安全模块是构建全链路数据安全防护体系的核心组件,承担着数据分级分类管控、敏感数据识别与脱敏、数据加密与水印溯源等关键职责。该模块为平台内数据提供从安全定级到访问豁免的全生命周期安全管理能力,既能通过多算法脱敏、AI 智能敏感识别实现数据隐私保护,又能借助加密算法管控、数据水印实现数据流转溯源,同时支持灵活的安全豁免策略配置,可满足不同业务场景下的数据安全合规与隐私保护需求,为数据治理与数据应用筑牢安全防线。
离线开发
离线开发模块是支撑批量数据加工处理的核心开发工具,主要面向非实时性的数据开发与分析需求,为数据工程师提供一站式的离线数据处理能力。该模块集成智能 SQL 开发、可视化作业编排等核心能力,不仅支持标准 SQL 语法的编写、调试与优化,还可通过拖拽式 DAG 图完成多组件的作业流程编排,兼容 Shell、Python、Spark 等多种计算任务,同时具备完善的作业版本管理与运行监控能力,能高效完成海量离线数据的清洗、转换与整合,为下游数据应用与数据资产化运营提供高质量的加工后数据。
实时开发
实时开发模块是支撑高时效性数据处理与分析的核心开发组件,主要面向实时数据流加工、实时业务监控等场景,为技术人员提供一站式的实时数据开发与运行管控能力。该模块支持 Web 界面 SQL 编写和图形化拖拽两种任务定义方式,兼容自定义 Flink 作业扩展,可适配多模式集群部署,同时具备作业快照恢复、运行状态监控等能力,能高效完成实时数据的清洗、关联、统计等加工操作,为下游实时数据服务、智能预警等业务提供低延迟、高可靠的实时数据支撑。
数据指标
数据指标模块是实现业务数据量化监控与价值洞察的核心应用组件,承担着企业核心业务指标全生命周期管理的关键职责。该模块支持原子指标、派生指标、自定义指标的多类型管理,可基于 SQL 脚本灵活创建并固化指标,同时提供指标集组合计算、周期自动关联统计及多维度可视化展示能力,还能通过开放 API 对接第三方 BI 系统,为业务决策提供标准化、可追溯、高可用的量化数据支撑,帮助用户实现业务运营状态的精准把控与数据驱动决策。
数据服务
数据服务模块是实现数据资产安全流通与价值输出的核心枢纽,承担着将平台内治理后的优质数据封装为标准化服务接口、支撑多场景业务调用的关键职责。该模块支持多类型接口发布、精细化服务管控及全流程接口生命周期管理,既能实现库表、SQL 等数据资源的快速接口化,也可构建复合服务与 MCP 服务满足复杂业务需求,同时提供完善的接口调试、授权、监控能力,为组织内外部业务系统提供安全、高效、灵活的数据访问渠道,打通数据从治理到应用的最后一公里。
智能问数
智能问数模块是平台依托大模型技术打造的轻量化数据查询工具,是降低数据使用门槛、实现数据普惠化的核心应用组件。该模块支持自定义问数数据集与专属问数助手,可将结构化数据资源转化为自然语言交互能力,让非技术人员无需编写 SQL 即可通过日常语言发起数据查询,同时具备问数记忆与多维度结果可视化能力,能快速输出精准的数据分析结论,为业务人员提供高效、便捷的自助式数据洞察渠道,加速数据价值向业务决策的转化。
数据资产
数据资产模块是实现全域数据资源资产化运营的核心组件,承担着高附加值数据的统一管理、发布共享与价值变现的关键职责。该模块支持表、API、视图、文件等多类型数据资源的全生命周期管控,可整合数据结构、血缘关系、质量监控等多维信息形成完整资产档案,同时提供资产发布、批量订阅、自助查询及资产大盘监控等能力,既能实现数据资产的规范化梳理与沉淀,又能打通内外部数据
核心优势
轻量级部署
产品提供一键安装包部署与云原生部署模式。一键安装包无需依赖任务第三方环境和组件,可以运行在标准linux系统或国产信创系统,普通服务器即可运行整个平台;云原生部署模式需要部署方提供容器运行环境,可以通过导入镜像的方式进行快速部署。
简单易用,三步即达
数盈平台作为类PAAS平台,本身具有开发属性,功能非常丰富,产品采用了极简的管理页面和操作流程,几乎做到每个一个目标结果操作三个概念即可完成目标,普通技术人员30分钟可以上手、使用。
无侵入增量数据采集
在很多场景下,业务库不能开启变更日志且无增量字段,但仍需要采集增量数据甚至是删除的数据,产品提供对数据库无任何侵入的增量采集方法,通过快照增量采集,采用高速比对算法来对源端数据进行比较,快速识别除数据的增、删、改操作,并按需同步到目标端。该能力适用国内外数据库、MPP数据库及数据仓库。
复杂数据质量问题发现
产品内置多种跨库、跨表、表、列、SQL校验规则;对于同一张表的多个规则,系统仅读取一次数据,确保数据的校验效率,在跨库、跨表校验时,会存在复杂的关联计算,如求和关联计算、三级关联校验,为了确保计算效率,系统会采用BitMap算法,对数据进行提前记忆和计算。质检完成后会生成二维质量报告,来展示当前业务的数据质量情况。
数据关系自动建立
产品自动采集数据交换、数据开发SQL、数据质量规则、数据服务关系生成数据血缘,建立数据质量分析结果、标准引用关系。也支持手工选择方式建立数据血缘关系、关联关系,允许对数据关系、数据质量进行评审,并对数据实现按需自助查询。
统一智调引擎
产品可以多方位控制系统并发,包括表的并发数、传输并发数、任务并发数、错误恢复策略等,同时,产品可基于各模块节点压力,自动计算并行任务数量,将任务分配到对应节点上运行,减少任务都积压到某些节点导致故障的情况发生,降低人工管理和运维成本。
产品模块自由装配
产品采用微服务、云原生技术架构开发和构建,设计过程中采用弱依赖方式进行引用,每个子产品模块均可独立运行,可独立解决对应场景业务,通常采用门户+子产品的任意自由组合,来解决不同场景下的业务问题。
高效的处理性能
- 单台服务可支撑20万条/秒的数据同步。
- 单台服务可支撑30万条/秒的数据质检。
- 单台服务可支撑2000个作业调度,作业并发数可达到1000个。
- 单台服务可支撑2000TPS应用接口请求。
国产信创环境下的无缝融合
产品已成功完成与一系列国产信息技术创新(信创)生态链中关键组件的适配与认证。包括多家国产芯片、操作系统、数据库系统、中间件以及大数据处理平台。通过与业界领先的信创厂商紧密合作,确保了产品的高度兼容性,能够在各类国产化环境中实现平滑部署与卓越运行。目前主要兼容测试的信创环境如下:
- 芯片:泰山TaiShan 200系列、龙芯3B3000、3B4000处理器、FT-2000+/64处理器、鲲鹏916、920处理器平台、腾云S2500处理器平台。
- 操作系统:银河麒麟高级服务器操作系统(飞腾版)V10、银河麒麟高级服务器操作系统(鲲鹏版)V10、统信服务器操作系统V20。
- 中间件:东方通应用服务器软件TongWeb V7.0、金蝶Apusic应用服务器软件V9/V10。
- 数据库:GBase 8a MPP Cluster V8、GBase 8s V8.8、巨杉数据库 SequoiaDB V5.0、金仓数据库管理系统 KingbaseES V7/V8、达梦数据库管理系统V8、HighGo Database V5。
- 大数据平台:浪潮云海Insight HD软件V4、华为FusionInsight HD。
成功案例与荣誉
智慧城市:东城区大数据支撑平台
北京市东城区科学技术和信息化局(大数据局)肩负贯彻落实科技与信息化政策法规、统筹相关工作等多项职责。依据国家及北京市相关文件精神,结合东城区 “十三五” 信息化建设规划,借助区内基础化设施优势,以推动大数据创新应用为导向。项目需求包括建设大数据支撑平台、资源中心及标准规范体系,打造支撑底座;建成目录链系统,梳理三级目录体系;建设领导驾驶舱等应用,完善大数据平台标准规范。
东城区在大数据工作中,多举措并行推进建设。首先以标准规范体系为先行保障,梳理规划1个总体及4大类共29项标准。其次,建设领导驾驶舱系统,以决策应用为牵引,依托大数据支撑平台构建指标体系,辅助领导决策。再者,通过东城区目录区块链系统梳理对接职责目录,完成街区52家机构近2100项职责目录梳理及对接,共收集了全区52个部门(37个委办局和13个街道)1162项数据资源目录,其中实现了985项数据资源挂载;整合建设了5大基础库,汇聚了各类数据共计3亿多条。资源库沉淀了全区基础数据、主题数据和高频数据,支撑整个东城区的大数据应用和服务。最后,利用新技术强化赋能,通过数据开放服务系统、数据应用超市、大数据查询系统、人口动态监测系统等,支撑各部门开展大数据应用。
智慧人社:南京人社数智指挥中心
南京市人社局承担多项职责,积极顺应数字化发展趋势。在习近平总书记相关指示及全国数字化推进大背景下,以构建人社数字化底座为依托,打造一系列应用场景实现 “智治”。项目需求涵盖数智指挥中心对多业务板块数据统计分析、业务经办大厅监控、数据回流、安全监控、数据交互平台分析等,还涉及零工市场推荐、多维度数字化画像平台及公共服务等多方面数据分析,以提升人社服务水平。
在数字化底座的加持下,在内部打破各条线业务板块的界限进行数据整合和汇聚,实现了人社业务“全数据共享、全服务上网”。全流程进系统,一屏览全域,为领导决策分析提供可视化支持。在外部积极与20个部门进行数据共享和数据交换,实现租房补贴等多个政务服务跨部门“一件事”的办理,通过人社数据能力输出,有效助力各部门间业务协同,数据贡献量位列全省前三。汇聚人社内部10979项数据,外部519项数据,各类数据累计856亿条,内外联动,通过分析研判、归纳应用,有效提升了数据准确性。
智慧医院:盛京医院科研数据平台
中国医科大学附属盛京医院是大型综合性数字化大学附属医院,拥有多院区及丰富学科资源和人才队伍。其科研项目面临诸多挑战:数据复杂性高,因医院业务平台系统差异、数据安全考量及网络沟通问题,数据抽取困难;非结构化数据处理棘手,电子病历结构化计算受医生表达习惯、南北差异、医院数据标准不同、医学对象及实体复杂等因素制约;统计分析复杂,科研人员缺乏相关知识与方法,传统软件难满足需求。项目需求包括整合多院区异构数据,对科研数据标准化治理,提取结构化与非结构化数据,保护医疗信息隐私数据,以及与学院及医院科研项目管理流程整合,实现自动化、一站式服务及与科研分析平台集成。
通过全量数据中心平台构建了面向全院的临床大数据中心,汇聚了超过210万的住院病历,3700万的门诊病历、8.5亿的医嘱数据、5000万条的诊断数据、7.5亿条检验项目数据、1600万的检查报告数据等。为全院各类数据应用提供全方位的服务支撑,如提高病历检索效率、节省数据收集时间、降低统计分析门槛、帮助撰写高分论文、保护患者隐私及管控学术不端问题等。
辽公网安备 21011202000133号

