SEO対策を気にかけていると、存在しないURLへのアクセスがある場合があります。「/h/12345.html」といったURLの場合は、サイトに誘導しようとするリファラースパムです。アクセス分析の邪魔をするリファラースパムの確認方法と、対処方法をご紹介します。
リファラースパムの確認方法
まずはアナリティクスで、「サイトコンテンツ」→「ランディングページ」を選択し、存在しないURL表示リンクをクリック。
そして、セカンダリ ディメンションを「参照元/メディア」に設定します。

すると、SEOのついたURLが!

つまりは、SEOに興味がある人にサイトにアクセスしてもらいたいわけです。
実際に参照元として表示されているURLにアクセスする場合には、URL(リンク・サイト)の安全・危険、ウイルスや詐欺フィッシングをチェックできる『SecURL』を利用するのがおすすめ。サイト表示を安全な画面で確認できます。

実際にそのURLにアクセスすると、別のURLに飛ばされるようで、セールスサイトが表示されました。
「あなたのWebサイトのポテンシャルを無料で調べてみませんか?」・・・(#゚Д゚)

SecURL情報から、アクセスしてもウィルスの問題はないもよう。

心配になるのは、アナリティクスにURLが表示されるような何かをサイトに仕込まれていないかということ。
この仕組みは参照元として表示されたURLに、アナリティクスで表示された存在しないURLを入力することで解明されました。

何も書かれていない真っ白なページが表示されましたが、ソースコードを見ると・・・
あっ!!!

「UA-」ではじまるアナリティクスコードが私のサイトのコードになっていました。
つまりは参照元となったページの配下に、アナリティクスのコードを貼り付けたページが作られちゃっているわけです。セキュリティに問題があるわけではないですが、迷惑!!
リファラースパムは「ホスト名」で除外
※注意:厳密にデータを計測したいサイトには、おすすめできません※
Googleアナリティクスの「ホスト名」の説明では、以下のように記載されています。

ユーザーがお客様のサイトにアクセスするときに使用したホスト名。通常はサイトのURLです。
実際に、セカンダリディメンションでホスト名を設定してみると、サイトのURL以外はリファラースパム的なURLばかりがずらりと並びました。

そこで、サイトのURL以外を除外します。
<設定>→<フィルタ>で、フィルタの種類を「定義済」にして、「右のみを含む」・「ホスト名へのトラフィック」・「等しい」で設定。
ホスト名には、httpを含まない自分のサイトのドメインを記載して、除外設定は完了です。

これで、リファラースパムは計測されなくなるはず。
ただざっくりした設定になり、キャッシュ(webcache.googleusercontent.com)や、翻訳(translate.googleusercontent.com)でのアクセスもはじかれてしまうので、割合が多いサイトは注意が必要なようです。
コメント