Snowflake Connector for Google Analytics Raw Data 的数据引入模型

使用 Snowflake Connector for Google Analytics Raw Data 需遵守 连接器条款

本主题提供有关 Snowflake Connector for Google Analytics Raw Data 支持的数据引入模型的信息。

从 Google Analytics 导出至 BigQuery

Google Analytics 支持两种类型的 BigQuery 导出:
  • 每日导出 – Google Analytics 将数据导出到名为 events_XXXXXX 的表中。收集完当天的所有事件后,表会在每天结束时创建一次。

  • 流式导出 - Google Analytics 全天不间断地导出数据,并将其存储到名为 events_intraday_XXXXXX 的表中。

连接器支持这两种类型的导出,并能自动下载在 BigQuery 中找到的所有表,无论这些表是每日表还是日内表。无需额外配置。

接收器表

对于每个属性,连接器会将事件保存到属性特定的表中,这些表在连接器配置上提供的数据库和架构中创建。对于每个属性,创建两个表:一个用于每日导出,另一个用于日内导出,分别命名为 ANALYTICS_XXXXXXXXXANALYTICS_INTRADAY_XXXXXXXXX。当 Google Analytics 中配置了这两种类型的导出时,连接器将同时引入两个表:先是日内表,然后是每日表。

每日表引入

当连接器识别到 BigQuery 中存在表时,会一次性下载整个表。表一旦下载,在今后处理中将不再重新考虑它。Google 会提醒,每日表可在创建后 72 小时内更新。当前版本的连接器不支持在接收器表中反映这种更新。

日内引入

连接器支持下载历史日内表(如果这些表存在于 BigQuery 中),以及持续引入仍在接受更新的日内表。

对于过去几天,连接器会以与每日表相同的方式下载日内表:每个表都是整体下载,一次下载一个表,直到下载到当日数据为止。

当连接器识别到日内表是 BigQuery 中的最后一个表时,就会开始增量处理该表。这意味着它全天以固定的间隔(默认为 8 小时)从表中下载传入的批量数据。

满足以下任一条件时:

  • BigQuery 数据集中出现了次日表

  • 自给定表首次加载已过去 24 小时

连接器对给定的日内表进行最后一次引入,然后切换到下一个表。

备注

少数事件可能无法引入,这与延迟超过 10 分钟的事件有关。即将推出的功能将解决这一问题。

如果需要更频繁的更新,可使用 CONFIGURE_INGESTION_INTERVAL 更改默认间隔值。

语言: 中文