googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました

「なが~ンのごちゃごちゃ」googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました ブログ
「なが~ンのごちゃごちゃ」googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました

昨晩から googleサーチコンソール を確認しています。

ブログ引越ししてから初めて googleサーチコンソール を確認してみた
gooブログから引っ越ししてきて、えーと....それなりにブログページの体裁のようになったのが10月13日頃だったと思います。そこを引っ越し完了した日としまして....(まだまだ気に入らないところがあるんだけど、ブログをかまっている時間も心のゆとりも無いという...)引っ越し完了した日から1ヶ月経ったので、googleサーチコンソールがどうなっているのかと確認してみました。はい、初の googleサーチコンソール確認 でございます。自分が後々にあの時はどうだっけ?と確認する意...

「ページがインデックスに登録されなかった理由」ってのを調べるのです。

2025年11月15日、「googleサーチコンソール」のページがインデックスに登録されなかった理由
2025年11月15日、「googleサーチコンソール」のページがインデックスに登録されなかった理由

「見つかりませんでした(404)」は物理的に記事内容を確認したりして解決です。


「重複しています。ユーザーにより、正規ページとして選択されていません」

「重複しています。ユーザーにより、正規ページとして選択されていません」ってのは…

googleサーチコンソール、ページがインデックスに登録されなかった理由-feed
googleサーチコンソール、ページがインデックスに登録されなかった理由-feed

ブログ記事URLの後ろに /feed/ ってのが追加されているものです。

feed ってホームページの更新情報をXMLで云々ってやつだったと記憶しているのですが….

ネットをググると…ほら私のうっすらとした遠い記憶は合っているみたい。

Webサイトの新着記事をいち早く取得!RSSフィードのURLを確認する方法
Webサイトの新着記事を自動で配信してくれる便利なフィードを活用しよう!「フィードとは何か?」「フィードのURLを確認する方法」についてお伝えします。

そんなのはもちろんインデックス登録不要なのでこのエラーでいいよね。

Googleサーチコンソールで「重複しています。ユーザーにより、正規ページとして選択されていません」と表示される - Google 検索セントラル コミュニティ

つまり、そのまま放置の助にしておこう。


「noindex タグによって除外されました」

次は、「noindex タグによって除外されました」です。

「なが~ンのごちゃごちゃ」googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました
「なが~ンのごちゃごちゃ」googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました

「replytocom」ってのがキーワードだね。

googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました -- 'robots' メタタグで 'noindex' が検出されました
googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました — ‘robots’ メタタグで ‘noindex’ が検出されました

ネットをググって、「ブログのコメントに返信するたびに生成されるURLパラメータ」と知る。

[WP]replytocomのURLパラメータをクロール拒否にする方法
ここまで複数回にわたって紹介させていただいているGoogle Search Consoleで監視対象のURLが増加している件ですが、今回はreplytocomのURLパラメータに関する調査と対応をしました。 ?replytocom=パラメー

試しに、次のURLをブラウザで確認する。

https://nagan.blog/hopewreck/post/bfbf6a9a52694f284e6bc73d43313857/?replytocom=71

たしかに、コメント毎にURLが生成されているんだわ。

googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました -- コメントにURLがあるのかよ
googleサーチコンソール、ページがインデックスに登録されなかった理由-noindex タグによって除外されました — コメントにURLがあるのかよ

コメントだから検索エンジンにindex登録されないように「noindex」指定をwordpressがしている。って、wordpressってそんなこともしているのかーい。

で、この「replytocom」がURLパラメーターとして、googleサーチが除外するようにすればいいわけで…

調べたら2方法あり。

一つは先のページで記されている Google Search Consoleのクロール設定 で指定する。

もう一つは、robots.txt に追記するもの。私がここに書くまでもなくよそ様が親切な情報ページを書いている。

にゃん分間待ってやる
「文章の書き方」や「アクセスアップ」などブログ運営のテクニックを解説。

で、私はどちらを採用するのかというと….

なるだけブログの設定とか、サーバー内のファイルを弄るというのはしたくないわけよ。

そういうところを触ると、後々のメンテをするときにどこをどうしたっけ?となるわけで….

「replytocom」についてはブログ記事に関する問題ではないので、googleサーチコンソール 側の設定でするのがスムーズではないかと…

Google Search Consoleのクロール設定 をしようとしたのですが、googleサーチコンソール のバージョン違いなのだろう、メニュー構成が違うよ。

メニューをいろいろと押して探すのだけど、Google Search Console のクロール、URLパラメーターに関する設定画面にたどりつけずです。

きっと、オイラはバカなんでしょう。みつかりません。わかりません。となりました。

AI先生に尋ねてみたら、Google Search Console の「クロール」>「URLパラメータ」は古いバージョンのもので、現行バージョンでは廃止されているという。


robots.txt を修正

いいもん、robots.txt 弄るもん。

自分のブログURLの robots.txt に、

Disallow: /?replytocom=

を追記するだけです。

なのですが、自分のサーバに robots.txt は存在しないのに、ブラウザーでアクセスすると robots.txt が表示されるどうなっとんねん?

またAI先生にお尋ねすると、 robots.txt が存在しないときはwordpressが自動返答で引き渡しているという。

だから、wordpressが自動生成している robots.txt をテキストファイルに起こしたうえで、Disallow: /?replytocom= を追記して、新規 robots.txt を作成してFTPでアップロードとなりました。

次は、Google Search Console の設定-クロールのrobots.txtをクリックして

googleサーチコンソール、ページがインデックスに登録されなかった理由-設定から robots.txt
googleサーチコンソール、ページがインデックスに登録されなかった理由-設定から robots.txt

再クロールをリクエストして、あとは寝て待つだけでいいよね。

googleサーチコンソール、ページがインデックスに登録されなかった理由-設定から robots.txt 再クロールをリクエスト
googleサーチコンソール、ページがインデックスに登録されなかった理由-設定から robots.txt 再クロールをリクエスト


「cocoon設定」>「seo」>「headタグに挿入」

あとは…

アーカイブページ https://nagan.blog/hopewreck/post/2018/07/page/3/ とかが引っかかっているのは…

wordpress、「cocoon設定」>「seo」>「headタグに挿入」 のところで

「その他のアーカイブページをnoindexとする」にチェックがはいっていたからではないかと思う。

headタグに挿入の noindex に関するチェックを全部外しておいた。

googleサーチコンソール、ページがインデックスに登録されなかった理由-cocoon の seo headタグに挿入-「その他のアーカイブページをnoindexとする」にチェック
googleサーチコンソール、ページがインデックスに登録されなかった理由-cocoon の seo headタグに挿入-「その他のアーカイブページをnoindexとする」にチェック


次の課題、「クロール済み – インデックス未登録」

次は….

「クロール済み – インデックス未登録」ってやつ。件数が多いよね。

googleサーチコンソール、ページがインデックスに登録されなかった理由-クロール済み-インデックス未登録
googleサーチコンソール、ページがインデックスに登録されなかった理由-クロール済み-インデックス未登録

/feed/のやつは先に設定したやつで対策できているはずだから置いといて…

とりあえず、指摘されているURL記事を確認してみる。

https://nagan.blog/hopewreck/post/d8fe8d1c8014802c1327671ceddfaeb5/

の欄にある虫眼鏡アイコンクリックして…

googleサーチコンソール、ページがインデックスに登録されなかった理由-クロール済み-インデックス未登録-サイトマップって?
googleサーチコンソール、ページがインデックスに登録されなかった理由-クロール済み-インデックス未登録-サイトマップって?

えーと、このページに出てくる二つのURL

参照元ページ
https://nagan.blog/hopewreck/post/dd50ffd17be43023723ee5b485ea105f/
ユーザーが指定した正規 URL
https://nagan.blog/hopewreck/post/d8fe8d1c8014802c1327671ceddfaeb5/

は、どちらも存在しているんよね。

となると….

参照元サイトマップが検出されませんでした

のワードが問題ってことだ。

サイトマップ・・・。それって何?

ってのを今晩は追及してみよう。

ここまでで、自分の記録として作業した内容をそのまま書き込んで置いた。

はい、ブログ初診者がするような初歩でしくじっているってことですな。

頑張りませう。

コメント

タイトルとURLをコピーしました