-
1:ID:.jMKE0 · 2021-08-06

全ての検索エンジンのクローラーを拒否する方法って何かありますか?
htaccessだと検索エンジンを全て指定しなければいけないと思いますし、robots.txtは無視されることもありますよね?

5 件の回答

2:ID:iHKbNK · 2021-08-06

不可能ですね。IPアドレスやホスト名だけでそれがロボットか否かがわかりません。個人のグローバルIPでもロボットみたいな動作はできるわけですから(スクレイピングなどで)

3:ID:Ir8PHO · 2021-08-06

2さんとかぶるけど、公言してるものでない限り、クローラを特定することができないと思いますよ。
よって、「すべての」という要件を満たすことは不可能です。
クローラ独特の仕様も多少はあるので、それを利用して独自にクローラ特定して、なんちゃって実装ならできると思います。

4:ID:8ipTWD · 2021-08-07

全ページに認証をかけ、アクセスした人の何かしらの操作で解除するとか?

6:ID:mI.wSX · 2021-08-11

「全ての」という前提を噛み砕いていかないと何とも言えない部分もありますが、
WAFを導入すれば可能ですね。

1 件の回答が除外されました。[詳細]
コメントの受付は終了しました。

一緒に読まれている質問

ページ上部に戻る