xその他‎ > ‎

ユーザーレベルでのデータ把握

ニーズは当たり前だけど、相当ある。

マーケティング => ユーザー像の把握による適切な情報のプッシュ=売り込み
と考えれば、当たり前の話である。

セッションレベルでのデータなんて、ごみのようだ。
ユーザー単位のデータから見た場合。

だが、google analyticsでは、セッションレベルのデータがメイン。(カスタム変数にユーザースコープのデータを入れておくしかない)

理由としては、
  1. 技術・リソース的な制約
  2. ユーザーが保持しているプライバシー権利への配慮
の二つだと思う。

1の技術・リソース的な制約は、程度の問題ではある。ユーザーレベルのデータ把握にはリソースが要ることを示すものとして、
レポートでユーザー数の算出には、アチラコチラで制限がかけられている。
  • api側では、ユニークユーザー数は提供されてない。
  • レポート側でも、カスタムレポートを作らないと算出しない。
データの扱い方を知らないし、その分野の知識もないけど、マシンパワーがいりそうではある。なので算出方法への想像もでる。

まあ、でも、
カスタム変数にunique identifierを入れれば、個別ユーザー追跡はできる。(プライバシーの話は後ろで)
一日あたり5万件までしかユニークデータ(個別フィールド=セグメント辺り)しかもてないのが制限になるが、カスタム変数のslotに分散して、slotを6個くらい使えば30万件だ。(カスタム変数は10個まで使えるそうだ、公式には5個)
ランダムな変数を振るとしたら、重複の可能性を狭めないといけないので、slot当たり5万件収容は無理だろうが、、、
まあ、そこそこのアクセス数のサイトなら問題ないし、たくさんデータが取れるサイトなら、それこそデータがサンプリングされても問題ない。(担当者は嫌と言うだろうが)


さて、仕様的にはある程度までは、個別ユーザー追跡ができるんだけど、
問題は、プライバシー問題である。

まずは、google analyticsのサービス利用規約。
7にプライバシーに関する記載がある。(以下は、そこの部分のコピペ)
7.  プライバシー  お客様は、本サービスを利用する(又は第三者が利用する)にあたって、本サービスをインターネット・ユーザーの個人情報の追跡又は収集に使用せず(かつ第三者にさせず)、お客様のウェブサイト(又は当該第三者のウェブサイト)から集めたデータを、ソースを問わず個人情報と関連づけない(かつ当該第三者に関連づけさせない)こととします。お客様は、適正なプライバシー・ポリシーを策定してこれを固守し、お客様のウェブサイトの訪問者からの情報の収集に関して適用される法令を全て遵守することとします。お客様はプライバシー・ポリシーを載せなければならず、当該プライバシー・ポリシーにはお客様が、ファーストパーティ cookie により匿名のトラフィックデータを収集していることが表示されなければならない。

個人を特定するような事はせず、google analyticsを利用した形での他のツールでの個人情報収集もアウト。プライバシーポリシーを提示しないといけない。

さて、個人の特定とはどういう事だろうか?

1.確実に問題となるのは、外部の個人情報とリンクさせることである。会員制サイトなら、会員のデータを持つわけだが、これと一対一でリンクさせるのはアウトだと読める。ただ、会員カテゴリーとリンクさせるのは良さそう。(カスタム変数のユーザースコープの設定例はその形だ)
会員カテゴリーは、どこまで細分化したカテゴリーが許されるのかは不明だが、、、たとえば、何月何日何時何分に会員になった人とか、、時間でのカテゴライズとも言えるが、事実上、個人特定に近い。

カテゴリー情報なのか、個人情報なのかは個別に見るしかないわけで、
つまり、分別の基準としてそういう基準がスタートラインだよと、、、しか言えない。

2.ただ、一番多くの人が思いつくのは cookieにユニークなIDが振られているので、それをカスタム変数に入れとけば良いのではという話だろう。
http://abc-analytics.com/google-analytics-apply-custom-variables ここのコメントでも質問されたように、既にやってる所もあると思う。

utmaのidを入れておけば、そのユーザーがコンバージョンするまでの、トラフィック情報の履歴も簡単に取れる。APIからだと、何回目の訪問はこのキーワードで、何日ぶりの訪問だったとかが、かなり整理した形で取れる。
コンバージョンまでの、参照元、日数、その時々の滞在時間、閲覧ページなどデータはなんでも出せるので、間接効果のattributionを自分で組み立てることも可能だ。

さて、これは、上の引用した部分の、個人情報の追跡に当たるのだろうか?
ウェブサイトでの行動の個人の追跡には当然なる。アクセス元の地域もある程度分かる。
しかし、IPが分かるわけでなく、いわゆる何かあったときに、プロバイダーを通して個人を特定できるわけではない。
この地域から何月何日にアクセスのあった人に、番号を振って履歴を記録してます。でも、わかるのは番号だけです。そこから、なんら個人情報への参照は断ち切られてます、、、、、
だが、eコマースの売上情報と、決済情報を、システムの外で照合すれば、その番号は"◯◯太郎" ということにはなる、、、数(割合)は少ないだろうが。
、、、
と、個別に疑問が起こる事例はある。
ひとつのログ収集ツール内で、情報を閉じていても(外部情報を参照しない)、システム的に機能がなくとも、人力でできる場面は必ず出てくるので、追求されたら(無罪証明をする)は難しい。 シラを切るのは簡単だが、非道徳的だ。

結論が無いから、ダラダラ書いてるんだけど、やったもん勝ちという状況は好ましくないので、ガイドラインなんかが出てくると良いのだが、英語圏でもそういう文書が見つからず、日本語でそんなものが出るわけない。















Comments