サーチコンソルを見ていてarchiveというものが3つ並んでいることに気づき、なにかと見に行ってみたところ魚拓サイトと呼ばれるものでした。
どうやらarchive.isは収集したサイト情報を書き換えてあたかも自分のコンテンツとなるようにふるまう物ということがいろいろ調べて判明!
「Archive.is」 は、ウェブページを引用するためのツールです。
とありますがほぼキャプチャしてほぼ〇パクリ・・・
表示するときはドメインが違う
サイト自体はarchive.isですが保存されたものを見るときはarchive.todayに移動したりarchive.todayのトップページを表示しようとするとarchive.isにリダイレクトされたりとなかなか不思議な挙動を取ります。
何はともあれ、せっかく作ったコンテンツを取られてはたまらないので早速ブロックすることにしました。
拒否する方法
下記IPアドレスを.htaccessに追記してください。
元のIPが変わっていなければこれだけで魚拓されるページはサーバー403になります。
Order allow,deny allow from all deny from archive.fo deny from archive.li deny from archive.is deny from archive.today deny from 173.249.51.142 deny from 94.242.57.138/18 deny from 139.162.218.90/19 deny from 146.0.72.195/24 deny from 146.0.75.2/24 deny from 151.236.217.7/21 deny from 178.62.195.5/17 deny from 46.166.139.173/21 deny from 78.47.86.130/15 deny from 78.108.190.21/20
IPアドレスは下記を参考にしています(リスト作成者様に感謝!)
https://blog.wolfs.jp/contents/archiveis-ipaddress/
コメント
この記事はいつ書かれた記事ですか?
右上にある通り2018.06.12ですので結構前になります。
今はSearchConsoleの仕様変更もあるのでSearchConsoleには関係ありませんがiframeでクリックジャッキングや自動コピーされている場合などはアドレスを変えればいいだけなので役に立つ可能性はあります。