【选型指导】从头构建数据分析,如何做好AnalyticDB PostgreSQL的产品选型

简介: ADBPG的产品线比较丰富,很多同学都想知道应该如何选择最适合自己的产品。本文从用户的数据链路视角切入,带大家快速基于现有的数据体系,构建ADBPG的数据仓库服务;

售卖形态介绍

ADBPG 目前主力在售的有两种形态,一种为存储弹性形态,另一种为serverless形态;


存储弹性: 该形态能力较为全面,无功能裁剪;产品成熟度非常高;

Serverless:该形态为ADBPG的主力演进形态,部分功能暂不支持,可参考功能对比;该形态支持计算秒级的弹性和存储的按需付费,可实现按需使用:同时全新架构在复杂分析,跑批等场景下的性能有极强的优势;


接下来,我们以数据链路的视角来帮助您在这个时刻选择最适合你的ADBPG产品规格;


链路选择

建议根据您目前保有的数据源进行选型。

如果您当下保有主要为大数据离线数据湖,请选择Serverless版本,它能够提供通过更快的通过攒批的方式 + DMS的任务调度完成进行导入;

如果您当下数据都保存在RDS、Polar DB或者在ECS上自建了数据库,我们建议您选择存储弹性模式,使用DTS进行快速的数据同步。存储弹性模式支持【主键】,可以快速承载您现在的表格式,完成一键建仓;


以下为典型数据格式的建仓及相关使用指导;


当前保有的数据存储

建议选型

快速开始指导

  • OSS 存储
  • Maxcompute 存储
  • HDFS 存储

Serverless 版本

若需要构建同步链路可参考:/article/893176 ,可根据不同的数据源进行调整;
数据源使用介绍:
1OSS数据导入: https://help.aliyun.com/document_detail/164815.html
2MaxCompute 数据导入:https://help.aliyun.com/document_detail/172968.html
3HDFS 数据导入:https://help.aliyun.com/document_detail/154138.html

  • RDS 和 Polar 数据库, 如MySQL、PostgreSQL、SQL Server;
  • ECS上自建的数据库
  • Flink流数据

存储弹性(高性能版)

对于OLTP数据库,需要使用DTS进行数据同步;
1构建数据链路:https://help.aliyun.com/document_detail/311152.html
2自建数据库导入: https://help.aliyun.com/document_detail/300120.html

Flink接入:https://help.aliyun.com/document_detail/408979.html




典型场景

  1. 更经济的数据仓库: 支持按需存储, 极低存储单价,对于大数据量且有分析需求的场景有着很强的适配性.
  2. 高性能海量数据分析: TB及以上的复杂数据分析可秒级返回,有明显的性能优势;
  3. 数据湖分析: 支持对数据湖数据进行高效分析,引擎支持一套引擎对多数源进行敏捷分析;
  4. 业务中台: 构建业务中台,支持业务数据ETL,分析,生成洞见的使用链路,支持企业报表,大盘等主要数据应用,支持业务;
  5. 可持续发展的数据平台: 极强的架构可扩展性,从单数据中台到“中心数据中台+多点数据市场”的灵活拓展,支持数据共享,秒级弹性,支持任意级别的数据平台建设;
相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
5天前
|
搜索推荐 数据可视化 数据挖掘
产品服务数据分析与报告
产品服务数据分析与报告
45 3
|
5天前
|
SQL Cloud Native 数据挖掘
云原生数据仓库产品使用合集之在使用 ADB 进行数据分析处理时,出现分区倾斜的情况,如何解决
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
5天前
|
Cloud Native 关系型数据库 OLAP
云原生数据仓库产品使用合集之阿里云云原生数据仓库AnalyticDB PostgreSQL版的重分布时间主要取决的是什么
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
5天前
|
运维 Cloud Native 关系型数据库
云原生数据仓库产品使用合集之原生数据仓库AnalyticDB PostgreSQL版如果是列存表的话, adb支持通过根据某个字段做upsert吗
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
5天前
|
SQL 数据采集 数据挖掘
构建高效的Python数据处理流水线:使用Pandas和NumPy优化数据分析任务
在数据科学和分析领域,Python一直是最受欢迎的编程语言之一。本文将介绍如何通过使用Pandas和NumPy库构建高效的数据处理流水线,从而加速数据分析任务的执行。我们将讨论如何优化数据加载、清洗、转换和分析的过程,以及如何利用这些库中的强大功能来提高代码的性能和可维护性。
|
5天前
|
SQL canal 运维
MySQL高可用架构探秘:主从复制剖析、切换策略、延迟优化与架构选型
MySQL高可用架构探秘:主从复制剖析、切换策略、延迟优化与架构选型
|
5天前
|
存储 数据挖掘 物联网
Python中的实时数据分析:构建流处理应用程序
【4月更文挑战第12天】本文介绍了Python在实时数据分析中的应用,包括实时数据分析的基本概念、Python的优势及基本流程。Python凭借丰富的库(如Pandas、NumPy)、强大的数据处理工具(如PySpark、Apache Kafka)和活跃的生态系统,成为实时数据分析的理想选择。文中通过社交媒体和物联网的数据分析案例展示了Python如何从数据获取、预处理、处理、存储到结果展示的全过程。通过学习和实践,读者可以掌握使用Python进行实时数据分析的技能。
|
5天前
|
SQL 存储 JSON
Flink+Paimon+Hologres 构建实时湖仓数据分析
本文整理自阿里云高级专家喻良,在 Flink Forward Asia 2023 主会场的分享。
|
5天前
|
SQL 存储 JSON
Flink+Paimon+Hologres 构建实时湖仓数据分析
本文整理自阿里云高级专家喻良,在 Flink Forward Asia 2023 主会场的分享。
71643 4
Flink+Paimon+Hologres 构建实时湖仓数据分析
|
5天前
|
存储 数据处理 Apache
万字长文 | 泰康人寿基于 Apache Hudi 构建湖仓一体平台的应用实践
万字长文 | 泰康人寿基于 Apache Hudi 构建湖仓一体平台的应用实践
103 0

热门文章

最新文章

相关产品

  • 云数据库 RDS PostgreSQL 版
  • http://www.vxiaotou.com