随着业务数据量不断增长的同时,数据结构也变得越来越灵活多样,数据不再局限于规整的结构化数据,半结构化、非结构化数据在数据域处理中的占比逐年上升,因此对不同模态的数据进行智能化数据处理的需求越来越迫切。
中国信通院在《数据库发展研究报告(2021 年)》中指出,在后关系型数据库阶段,数据结构越来越灵活多样、业务类型越来越复杂多变,为应对此类现状,越来越多的用户选择通过多模型数据库实现“一库多用“,将各种类型的数据进行集中存储、查询和处理,满足对结构化、半结构化和非结构化数据的统一管理需求。
argodb支持关系型书存储,宽表存储、搜索引擎、事件存储、图存储、键值存储、时序数据存储等全场景10种数据模型,满足多种数据模型处理场景和复杂业务需求。argodb多模支持大对象存储,结构化和非结构化数据统一存储,有效降低成本。
在架构上,argodb基于存算解耦,实现了多模数据库的“四个统一”:
统一的sql编译引擎,支持sql 99/2003 标准语法,兼容td,oracle,db2等多种方言,对不同模式的数据提供统一接口,将多个操作访问入口变为一个入口,将多种数据库语言变为一种语言,降低开发和迁移成本,简化用户操作。
统一的计算引擎,将多套计算引擎变为一套引擎,将多份计算资源变为一份资源,提供高性能的分析计算和执行效率,满足跨模型数据复杂关联分析场景。
统一的存储管理系统,同时支持分析型行列混合存储、支持具有搜索功能的文本存储等多模异构存储,并保证数据的强一致性,数据只需一次入库,即可通过异构存储的访问能力支撑多样化复杂分析场景,降低运维成本,将分散存储管理变为统一存储管理,极大简化系统架构,减少开发运维成本。
统一的星环云原生操作系统,支持 arm x86的混合架构,用户可以利旧硬件,大幅降低成本。
统一的元数据管理 统一的事务管理 完备的多模优化器支撑了对不同模态数据的统一读取调度,高效便捷地实现多模态融合分析。
以国内某三甲医院为例,经过十多年的信息化建设,该医院已经初步建立了his(医院信息系统)、lis(实验室信息管理系统)、pacs(影像归档和通信系统)、电子病历等多套信息系统,并积累了大量的临床数据。除了结构化、半结构化数据,还有海量、高价值的医疗影像等非结构化数据。为了存储、查询和处理这些不同类型的数据,这些系统独立建设、缺乏集成、元数据不统一和标准不统一,给数据的查询和处理带来重重困难。为了解决这些问题,加速医院业务数字化发展,医院基于多模型数据库argodb建设了临床数据中心底层大数据平台,将医院中各种类型的数据(例如电子病历、医疗影像、检验报告、生物样本和文献等)集中在argodb中存储、查询和处理,并能够满足跨不同数据模型的复杂分析需求,从而充分发掘医疗数据的宝贵价值,最终提高医疗质量、降低医疗成本。
随着数据与业务的并行发展,对数据的融合分析处理逐渐成为数据库技术发展趋势。当数据仓库与数据湖数据集市协同处理时,带来的是数据孤岛的打破,以及数据计算边界的拓宽。
基于argodb打造的湖仓集一体架构,能够实现在同一平台中,避免数据移动,将原始的、加工清洗的、模型化的数据,共同存储于一体化的“湖仓集”中,既能面向业务实现高并发、精准化、高性能的历史数据、实时数据的查询服务,又能承载分析报表、批处理、数据挖掘等分析型数据集市业务,真正意义上为用户提供湖仓集一体的场景凯发k8官网下载的解决方案。
通过argodb打造的湖仓集一体方案,用户可以基于统一访问接口,将多种数据库语言变为一种语言,最大程度上降低数据湖、数据仓库、数据集市业务过程中业务接口的调整,降低用户开发成本和使用门槛,提高数据处理效率。统一计算引擎将多份计算资源变为一份资源,降低集群复杂度和运维难度。统一存储管理,将分散存储管理变为统一存储管理,对使用者屏蔽不同数据源的数据存储,降低业务数据管理难度。
通过argodb一体化多模数据库架构实现全数据,全场景,全融合,最大限度降低企业tco,打造面向数据模态融合扩展的湖仓集一体化平台。
此外,基于argodb打造的湖仓集一体方案可以无缝衔接ai技术,帮助业务挖掘更多数据价值。