7月17日,gartner发布了《2023年中国数据、分析及人工智能技术成熟度曲线》(即《hype cycle for data,analytics and ai in china,2023》)报告,星环科技能够同时在数据共享、湖仓一体、自主研发、知识图谱和数据科学平民化(即data sharing,lakehouse,dbms self-sufficiency,knowledge graphs,citizen data science)5项技术领域入选代表供应商,凭借的是其覆盖数据全生命周期的基础软件产品。
此前,星环科技曾入围gartner《2022年分析与商业智能技术成熟度曲线报告》(即《hype cycle for analytics and business intelligence,2022》jul.2022)、《图数据库管理系统市场指南》(即《market guide for graph database management systems》aug.2022),被列为数据中台和图数据库的全球代表供应商。此次在5种技术领域的同时入围,充分体现了星环科技在数据分析和人工智能领域的技术优势和独特价值。
入围领域1:数据共享(data sharing)
数字经济是中国企业的战略举措,数据流通是其中必不可少的一部分,它推动效率,并通过多元用户实现数据的重复使用。数据的流通为企业提供了利用内外部数据更好地进行业务决策的机会,将数据变现,并与凯发k8官网下载的合作伙伴创建一个无法仅凭内部数据实现的协作生态系统。在内部,包括总部与下属机构,或分支机构之间的数据共享;在外部,则会涉及跨行业合作或跨公共部门等各方间的数据流通。
然而,数据的安全和隐私保护和是企业和组织在数据流通前需要解决的问题。为解决以上痛点,星环科技自主研发了transwarp navier数据要素流通平台,企业或组织可以通过可信沙箱、隐私计算等技术手段,打破数据访问的障碍和数据孤岛的壁垒,从而形成数据价值的迸发。
transwarp navier最新发布的3.1版本支持公共数据授权运营和企业数据流通的安全合规场景,新版本的产品功能及性能也迎来了全面升级,支持亿级大数据量,性能总体提升10倍,让企业和组织的数据要素流通更安全、合规、便捷。
入围领域2:湖仓一体(lakehouse)
湖仓一体(lakehouse)架构,从本质上区别于湖 仓并存的烟囱式架构,将数据湖与数据仓库的优势有机的结合起来,可以有效降低企业系统架构的复杂度,通过架构的统一,降低数据冗余,降低了存储的开销,也减少了数据加工的链路,时效性更好,同时也可以避免混合架构带来的开发难、运维难等问题。
星环科技能够入选该报告“湖仓一体”主题代表供应商,凭借的是其新一代的湖仓集一体架构技术。星环科技湖仓集一体架构,打破数据湖、数据仓库、数据集市的边界,基于湖仓集一体平台,所有人都可以访问实时的数据、历史的数据、原始的数据、加工过的数据,如业务分析师可以直接访问最原始的数据,数据工程师可以更高效地建模,数据科学家可以横跨不同的数据源进行数据分析和挖掘。通过统一sql引擎和统一计算引擎,实现湖仓集数据的统一处理、查询、加工,支撑多种应用场景,配合统一的运维、审计、权限、告警等功能实现平台的统一管理,避免重复建设。
相比于开源湖仓,tdh湖仓集一体具有支持四种事务隔离级别,支持小文件灵活自动合并、实时数据快速读写、无需流转,湖仓集一体化存储等优势,帮助用户降低开发运维成本,提高开发分析效率,提升数据处理分析性能。
入围领域3:自主研发(dbms self-sufficiency)
在中国不同行业的数字化转型中,数据库作为数据基础设施的关键组成部分,需要具有高性能、高扩展、强大的人工智能兼容性和成本效益等特性。与此同时,近年来高度动态的地缘政治环境要求中国企业需要确保数据库技术的自主可控。这两个因素推动中国新一代数据库的快速发展。
星环科技始终坚持“自主原创,领先一代”的技术发展路线,在分布式技术、多模型技术、数据库技术等方面有很多的积累,推出了一系列国产化分布式数据库产品,如分布式分析型数据库argodb、分布式交易型数据库kundb、分布式图数据库stellardb、分布式时序数据库timelyre、分布式搜索引擎transwarp scope、分布式向量数据库transwarp hippo等,利用先进的技术去替代老的技术,为用户提供更好的技术架构、更高的性能、更好的易用性、满足更多的场景等等,助力用户实现国产化升级。
星环科技在gartner 2022年12月发布的《中国数据库管理系统发展趋势探析》(即《exploiting the evolving database management system trends in china》dec.22)中也被提及,是中国数据库管理系统产品品类最多的厂商之一。此外,星环也积极融入信创生态,目前已完成了数百项信创生态适配,包括国产操作系统、芯片、服务器、中间件等,帮助企业更高效地打造全栈自主可控的数据平台。
入围领域4:知识图谱(knowledge graphs)
知识图谱是一种连接物理世界和数字世界知识的网络结构体系,包括实体(即节点)及其关系(即连接各节点的边)。它以直观的方式捕捉和存储世界的信息,记录各项事物的属性及事物之间关联。因此,图的数据模型通常比其他类型的数据模型更易于理解、操作和使用。由于更擅长处理和挖掘深度的关联关系,知识图谱被大量用于金融调查分析、产品推介、元数据管理。当然,知识图谱作为人类知识和商业智慧的载体,现今也作为大语言模型的有机组成部分,用来实现通用大模型的长期记忆,并构成更加专精的领域大模型。
星环科技自主研发的sophon kg是一款集知识的建模、抽取、融合、存储、计算、推理以及应用为一体的知识图谱产品,支持低代码图谱构建、智能化知识抽取、多模态知识存储、分布式图计算以及多维度的图谱分析。星环科技近期也推出了结合知识图谱、图数据库和向量大模型的问答系统,企业基于具体的行业知识语料,可快速构建更精通特定行业知识的领域大模型,打造具备高效人机交互的业务应用。
入围领域5:数据科学平民化(citizen data science)
数据科学或ai的平民化,一直是星环科技的人工智能团队致力于“授人以渔”的目标。在中国市场,专业的数据科学家往往具备很高的成本。为了让非专业对口的业务人员或管理者也能自主和便利地进行数据分析,将各自的业务经验和敏锐洞察快速形成业务决策,驱动企业创新和业务增长,星环科技利用ai技术和强大的产品化能力,将人工智能的普惠化和平民化做到了极致。
星环科技的智能分析工具sophon内置了数百个算子,支持用户通过拖拉拽的方式构建数据分析的任务流。在3.2的新版本中,发布了样本仓库、模型仓库和应用仓库,以环环相扣的产品理念,帮助用户将企业内多模态的数据,快速转化为模型,并对接模型能力到业务系统中。
为进一步实现ai人人可获得的理念,星环科技推出了“solar求索”大数据分析的领域大模型,可作为代码生成助手,内置在tds等产品当中。用户只需要输入自然语言,星环求索就可以自动生成可执行的sql或cypher代码,完成数据检索、数据分析和图表绘制等任务。在不同的sql任务难度下,星环求索表现出了bloom/belle及chatglm等大语言模型6至30倍的sql任务执行准确率优势。
星环科技此次在gartner报告的数据共享、湖仓一体、自主研发、知识图谱和数据科学平民化5项技术领域,同时成为代表供应商,代表了公司在技术实力、产品能力和市场吸引力等方面得到了行业的认可。未来,星环科技将持续致力于大数据、分布式数据库、人工智能和数据云领域的技术创新和产品优化,为企业数字化转型提供坚实的基础软件支撑。
参考文献:
[1]gartner,hype cycle for data,analytics and ai in china,2023,julian sun,ben yan,xingyu gu,fay fei,mike fang,tong zhang,july 2023