ABCABC Tech Catalog

#BigQuery

24件の記事

データ関連

BigQueryで週次集計の「年またぎ」問題を解決!ISOWEEKの使い方

この記事では、BigQueryでの週次集計におけるISOWEEKの活用法を解説しています。年末年始の集計での分断を防ぎ、ISO8601に基づいた週番号を使用することで、過去のデータ比較やチーム内の共通認識を向上させる方法が紹介されています。

中村卓矢
Tips

WINDOW句で重複するクエリを共通化してSQLをスマートに!

この記事では、SQLのWINDOW関数を使って、クエリ内での重複したOVER句を共通化し、可読性と保守性を向上させる方法を解説しています。具体的なクエリの例を通じて、効率的なデータ分析を実現するテクニックが紹介されています。

中村卓矢
データ関連

NULLも含めて正しく判定!「IS DISTINCT FROM」活用術

この記事では、SQLにおけるNULLの扱いに関する問題点と、IS DISTINCT FROMの活用法を紹介しています。この演算子はNULLを含む比較において、直感的な挙動を実現し、クエリの可読性と安全性を向上させる方法を解説しています。

中村卓矢
データ関連

Dataform × BigQuery のトランザクションでアトミックなテーブル更新を実現

この記事では、BigQueryのトランザクション機能を活用し、Dataformと組み合わせることで、データ更新時の欠損を防ぎ、アトミックなテーブル更新を実現する方法について詳しく解説しています。

中村卓矢
データ関連

BigQuery での ML.GENERATE_TEXT から AI.GENERATE への移行検証

この記事では、BigQueryのML.GENERATE_TEXT関数から新しいAI.GENERATE関数への移行検証として、各関数の使い方について説明しています。新しくレスポンスの構造化、出力スキーマの指定などにも対応しており、従来より便利に使える関数となっています。

伴拓也
Tips

BigQuery と Looker のソート順の違いから知る JavaScript の 日本語環境でのソートの罠

この記事では、LookerとBigQueryにおけるソート順の違いを通じて、日本語環境でのJavaScriptの localCompare メソッドの挙動を解説しています。特に、日本語の漢字が音読みベースで並び替えられるため、予期しない順序になることがあることについて触れています。

伴拓也
データ関連

SQL での ARRAY 加工時 ARRAY_AGG だけでは並び順は保証されない

BigQuery を初めとする環境で SQL によって配列を加工するとき、 ARRAY_AGG という関数で配列に加工をすることがありますが、そのとき「並び順は保証されていない」ということになっています。本記事ではそのような仕様にどのように対応すべきかについてまとめています。

伴拓也
データ関連

Supabase の DB と BigQuery を Datastream を使って連携させる

オープンソースの BaaS として最近利用事例も増えてきた Supabase 内のDBの内容を分析等の目的で BigQuery にコピーする方法として、Google Cloudのマネージドサービスである Datastream を利用する場合のポイントについて解説しています

伴拓也
研究開発

BigQuery ML で Gemini を利用して Google 検索によるグラウンディングを試してみた

BigQuery MLでGoogleの生成AI「Gemini」を利用することで、既存のデータから新たなデータを生成できるとともに、その結果についてGoogle検索を用いたグラウンディングを行うことで精度が向上することが確認できました。

中村卓矢
データ関連

BigQueryで日付変更時間を0時じゃなくしたいときどうするべきかを考える

BigQueryでデータ分析をしている際に、0時で日付が変わるのではなく3時や5時といった早朝時間帯に日付を変えて分析したい、というシチュエーションはよくあるかと思います。本記事ではそういったときにクエリ上でどのように対応すれば良いかをまとめています。

伴拓也
データ関連

え!BigQuery UtilsのUDFってもう全世界公開されていてリージョン気にせず使えるってほんと?

BigQuery UtilsにはBigQueryで処理をする上で便利なUDF(ユーザー定義関数)が多数含まれています。これまではUSリージョンでのみ公開されていたため、なかなか東京リージョンなどでは使いにくい状況が続いていましたが、今年の6月に実はもう全世界公開されていたのでその使い方を紹介します。

伴拓也
データ関連

LookerでGA4のエンゲージメント時間を可読性良く可視化する方法

Google Analytics 4(GA4)のエンゲージメント時間データをLookerでより見やすく可視化するための方法を紹介しています。value_formatパラメータを活用して、ミリ秒単位のデータを人間が理解しやすい「時間:分:秒」形式に変換することで、データの可読性を大幅に向上させることができます。

石田直之