Snowflake Connector for Google Analytics Raw Data 的数据引入模型¶
使用 Snowflake Connector for Google Analytics Raw Data 需遵守 连接器条款。
本主题提供有关 Snowflake Connector for Google Analytics Raw Data 支持的数据引入模型的信息。
从 Google Analytics 导出至 BigQuery¶
- Google Analytics 支持两种类型的 BigQuery 导出:
每日导出 – Google Analytics 将数据导出到名为
events_XXXXXX
的表中。收集完当天的所有事件后,表会在每天结束时创建一次。流式导出 - Google Analytics 全天不间断地导出数据,并将其存储到名为
events_intraday_XXXXXX
的表中。
连接器支持这两种类型的导出,并能自动下载在 BigQuery 中找到的所有表,无论这些表是每日表还是日内表。无需额外配置。
接收器表¶
对于每个属性,连接器会将事件保存到属性特定的表中,这些表在连接器配置上提供的数据库和架构中创建。对于每个属性,创建两个表:一个用于每日导出,另一个用于日内导出,分别命名为 ANALYTICS_XXXXXXXXX
和 ANALYTICS_INTRADAY_XXXXXXXXX
。当 Google Analytics 中配置了这两种类型的导出时,连接器将同时引入两个表:先是日内表,然后是每日表。
每日表引入¶
当连接器识别到 BigQuery 中存在表时,会一次性下载整个表。表一旦下载,在今后处理中将不再重新考虑它。Google 会提醒,每日表可在创建后 72 小时内更新。当前版本的连接器不支持在接收器表中反映这种更新。
日内引入¶
连接器支持下载历史日内表(如果这些表存在于 BigQuery 中),以及持续引入仍在接受更新的日内表。
对于过去几天,连接器会以与每日表相同的方式下载日内表:每个表都是整体下载,一次下载一个表,直到下载到当日数据为止。
当连接器识别到日内表是 BigQuery 中的最后一个表时,就会开始增量处理该表。这意味着它全天以固定的间隔(默认为 8 小时)从表中下载传入的批量数据。
满足以下任一条件时:
BigQuery 数据集中出现了次日表
自给定表首次加载已过去 24 小时
连接器对给定的日内表进行最后一次引入,然后切换到下一个表。
备注
少数事件可能无法引入,这与延迟超过 10 分钟的事件有关。即将推出的功能将解决这一问题。
如果需要更频繁的更新,可使用 CONFIGURE_INGESTION_INTERVAL 更改默认间隔值。