1:ID:.jMKE0 · 2021-08-06

全ての検索エンジンのクローラーを拒否する方法って何かありますか？
htaccessだと検索エンジンを全て指定しなければいけないと思いますし、robots.txtは無視されることもありますよね？

いいね! 5 あとで

5 件の回答

時系列表示 — 階層表示

2:ID:iHKbNK · 2021-08-06

不可能ですね。IPアドレスやホスト名だけでそれがロボットか否かがわかりません。個人のグローバルIPでもロボットみたいな動作はできるわけですから（スクレイピングなどで）

3:ID:Ir8PHO · 2021-08-06

2さんとかぶるけど、公言してるものでない限り、クローラを特定することができないと思いますよ。
よって、「すべての」という要件を満たすことは不可能です。
クローラ独特の仕様も多少はあるので、それを利用して独自にクローラ特定して、なんちゃって実装ならできると思います。

4:ID:8ipTWD · 2021-08-07

全ページに認証をかけ、アクセスした人の何かしらの操作で解除するとか？

6:ID:mI.wSX · 2021-08-11

「全ての」という前提を噛み砕いていかないと何とも言えない部分もありますが、
WAFを導入すれば可能ですね。

1いいね!

1 件の回答が除外されました。[詳細]

コメントの受付は終了しました。