Snowflake Connector for MySQL 的成本治理

备注

使用 Snowflake Connector for MySQL 需遵守 Connector 条款

本主题提供有关成本治理和为 Snowflake Connector for MySQL 找到最佳仓库大小的最佳实践。

衡量连接器的成本

如果连接器有一个仅用于数据引入和存储的单独账户,并且该账户没有显示其他活动(例如用户使用所引入的数据执行查询),则您可以读取账户级别的总体成本。要了解更多信息,请参阅 探索总体成本

如果账户不仅仅专用于连接器或者需要进一步调查成本,则应分别分析三个组件的收费成本:

有关成本这三个组成部分的介绍,请参阅 了解总体成本

一般建议

要获取连接器产生的费用,我们建议创建一个单独的账户,专门用于使用连接器。使用特定账户可以跟踪连接器生成的确切数据传输。

如果您无法为连接器使用单独的账户,请考虑以下操作:

  • 创建一个单独的数据库来存储引入数据,以便更轻松地跟踪存储成本。

  • 仅为连接器分配仓库以获得准确的计算成本。

  • 对数据库和仓库使用 对象标签,构建自定义成本报告。

计算成本

我们建议您仅为连接器使用一对专用的运营和计算仓库。此配置允许您在这两个仓库上创建 资源监视器。您可以使用监视器来发送电子邮件警报并暂停使用这两个仓库,在超出设置的 credit 配额时停止连接器。

备注

在引入大量数据的配置中将 credit 配额设置得太低可能会导致连接器无法引入所有数据。

有关如何查看仓库消耗的 credit 的信息,请参阅 探索计算成本。您还可以为仓库分配 对象标签,并使用标签创建成本报告。

存储成本

MySQL 6.0.0 连接器将数据存储在以下位置:

  • 连接器数据库,该数据库在安装连接器时创建,用于保存连接器内部状态。

  • 一个或多个其他数据库,这些数据库在配置数据源时创建,用于存储引入的数据。

Snowflake 故障安全 功能也使用数据存储。故障安全中存储的数据量取决于连接器已完成的表更新。因此,如果从源数据库引入的表行频繁更新或重新加载整个表格,则数据量会增加。通常,连接器设置后七到十天,故障安全数据量会稳定下来(假设未执行重新加载并且引入的数据流速率稳定)。

如果您想使用 Snowsight 检查存储空间用量,我们建议您使用单独的数据库来存储引入的数据。通过这种方式,您可以按对象筛选存储空间用量图表,该图表按单个数据库显示使用情况。您也可以通过查询 DATABASE_STORAGE_USAGE_HISTORY 视图,以及按连接器使用的数据库进行筛选,来查看存储空间用量。

如果数据库包含与连接器无关的其他架构,您可以查询专门用于从连接器引入的数据的特定架构的存储空间用量。您可以先按数据库和架构名称筛选,并汇总包含存储空间用量的列,再从 TABLE_STORAGE_METRICS 视图获取这些信息。

数据传输成本

连接器使用 Snowflake Snowpipe Streaming 功能将数据从源数据库传输到您 Snowflake 账户中的目标数据库。

有关如何检查 Snowpipe Streaming 消耗的 credit 的信息,请参阅 Snowpipe Streaming 成本

确定连接器实例的最佳仓库大小

一个重要好处是计算仓库大小可以根据数据量进行调整。连接器通常需要一个 XSMALL 运营仓库和一个 XSMALL 计算仓库,并且在数据引入期间不利用更大的仓库。

要找到连接器的最佳仓库大小,应考虑影响连接器性能的因素,例如源数据库的大小、变更的数量、启用的数据源和表的数量。

我们建议您定义一组可衡量的预期,例如复制延迟,并选择满足这些预期的最小仓库大小。或者,如果您只想试用连接器并启用单个表进行引入,X-小仓库应该足够。

要确定是否可以缩小仓库规模,请参阅 监控仓库负载

语言: 中文