大数据分析应用
SmartEDB HPC为大数据分析应用提供了极速的存储方案,高可扩展性、低延迟且具备高级分析性能的技术支持,确保能够高效、准确地完成各类复杂的数据分析任务。
HPC包含了针对大数据分析应用场景优化的特性。
在库分析
大数据分析在现代商业中的应用,覆盖了机器学习、金融交易、数字营销、医疗健康、网络通信等各个领域。在库分析功能在大数据分析应用中,为满足各种场景的需求提供了提升统计分析性能的函数集。
高可用性
eXtremeDB提供了一套完整的高可用性功能,可通过主从和多主数据库配置,以及主动复制结构技术实现。根据应用程序的需求,这些功能可以单独部署,也可以无缝协同工作,确保数据的最大可用性,并促进复杂异构环境中的查询负载均衡。
流水线策略
流水线策略是eXtremeDB的一项数据处理技术,结合数据库系统的向量统计函数,形成处理时间序列数据的流水线来加速处理过程。以一个函数的输出成为下一个函数的输入,在函数间传递数据,减少CPU缓存和主内存间的传输,从而获得超低延迟的计算流程。通过流水线策略进行数据处理,可以最小化数据传输并最大限度地利用CPU的L1/L2/L3缓存。
时间序列分析
将分析和在线事务处理(Online Transaction Processing,OLTP)查询结合起来是当今高性能数据库系统的常见要求。eXtremeDB支持两种存储格式:
- 适用于时间序列数据的列式存储,非常适合处理交易流和机器生成的物联网数据;
- 而传统的行式存储则是处理OLTP工作负载的标准方式。
分片技术
高效的大数据处理通常需要借助数据分片技术。通过分片技术,每个分片均由DBMS服务器的一个独立实例进行高效管理。分片技术允许将数据分布在多个物理节点上,或者同一节点的不同分片上,以最大利用I/O和CPU的性能。
分布式查询处理
在分布式环境中,分布式查询处理(Distributed Query)技术可以利用多台服务器/内核/CPU的计算能力,对数据库操作采取并行执行的方式,从而极大地提升查询性能。
