Google cloud platform BigQuery中字节的使用情况?

Google cloud platform BigQuery中字节的使用情况?,google-cloud-platform,google-bigquery,Google Cloud Platform,Google Bigquery,我想知道有人在BigQuery中使用BYTES类型的用例是什么?在挖掘提供的公共数据集时,我能找到字节数据类型用法的唯一地方是比特币\u区块链数据集,在这种情况下,数据看起来可以被base64编码为字符串(简单看一下预览,似乎已经是这样了) 所以基本上我的问题是使用Bytes数据类型的一些用例是什么,在这些用例中,使用String类型是不容易的。(是否有人将多媒体数据存储在BQ或数据仓库中?)。BQ是否可以在没有字节类型的情况下执行当前的所有操作,或者这是一种基本(和使用过的)类型?BASE64

我想知道有人在BigQuery中使用
BYTES
类型的用例是什么?在挖掘提供的公共数据集时,我能找到
字节
数据类型用法的唯一地方是
比特币\u区块链
数据集,在这种情况下,数据看起来可以被base64编码为字符串(简单看一下预览,似乎已经是这样了)


所以基本上我的问题是使用Bytes数据类型的一些用例是什么,在这些用例中,使用String类型是不容易的。(是否有人将多媒体数据存储在BQ或数据仓库中?)。BQ是否可以在没有字节类型的情况下执行当前的所有操作,或者这是一种基本(和使用过的)类型?

BASE64字符串将数据按大小膨胀33%。考虑到BigQuery会根据存储的数据大小和扫描的数据大小向您收费,如果存在大量二进制数据,且成本令人担忧,那么字节会降低成本。

我认为非unicode字符串最好存储为
字节,而不是
字符串
,以确保兼容性。这可能是为了确保遗留系统和不太典型的系统可以轻松加载到BQ,而无需进行转换。我怀疑它是用于二进制blob存储的。明白了,但是你知道一个实际情况是这样的用例吗?应该有很多。我知道的一个例子是,为了实现加密切碎(在非常小的粒度中),需要一个加密密钥表。由于密钥是由KEYS.NEW_KEYSET()生成的,它返回字节,而AEAD.DECRYPT_函数只接受字节形式的密钥集,所以将密钥保存在字符串中没有意义。