昨晩から googleサーチコンソール を確認しています。

「ページがインデックスに登録されなかった理由」ってのを調べるのです。

「見つかりませんでした(404)」は物理的に記事内容を確認したりして解決です。
「重複しています。ユーザーにより、正規ページとして選択されていません」
「重複しています。ユーザーにより、正規ページとして選択されていません」ってのは…

ブログ記事URLの後ろに /feed/ ってのが追加されているものです。
feed ってホームページの更新情報をXMLで云々ってやつだったと記憶しているのですが….
ネットをググると…ほら私のうっすらとした遠い記憶は合っているみたい。

そんなのはもちろんインデックス登録不要なのでこのエラーでいいよね。
つまり、そのまま放置の助にしておこう。
「noindex タグによって除外されました」
次は、「noindex タグによって除外されました」です。

「replytocom」ってのがキーワードだね。

ネットをググって、「ブログのコメントに返信するたびに生成されるURLパラメータ」と知る。

試しに、次のURLをブラウザで確認する。
https://nagan.blog/hopewreck/post/bfbf6a9a52694f284e6bc73d43313857/?replytocom=71
たしかに、コメント毎にURLが生成されているんだわ。

コメントだから検索エンジンにindex登録されないように「noindex」指定をwordpressがしている。って、wordpressってそんなこともしているのかーい。
で、この「replytocom」がURLパラメーターとして、googleサーチが除外するようにすればいいわけで…
調べたら2方法あり。
一つは先のページで記されている Google Search Consoleのクロール設定 で指定する。
もう一つは、robots.txt に追記するもの。私がここに書くまでもなくよそ様が親切な情報ページを書いている。
で、私はどちらを採用するのかというと….
なるだけブログの設定とか、サーバー内のファイルを弄るというのはしたくないわけよ。
そういうところを触ると、後々のメンテをするときにどこをどうしたっけ?となるわけで….
「replytocom」についてはブログ記事に関する問題ではないので、googleサーチコンソール 側の設定でするのがスムーズではないかと…
Google Search Consoleのクロール設定 をしようとしたのですが、googleサーチコンソール のバージョン違いなのだろう、メニュー構成が違うよ。
メニューをいろいろと押して探すのだけど、Google Search Console のクロール、URLパラメーターに関する設定画面にたどりつけずです。
きっと、オイラはバカなんでしょう。みつかりません。わかりません。となりました。
AI先生に尋ねてみたら、Google Search Console の「クロール」>「URLパラメータ」は古いバージョンのもので、現行バージョンでは廃止されているという。
robots.txt を修正
いいもん、robots.txt 弄るもん。
自分のブログURLの robots.txt に、
Disallow: /?replytocom=
を追記するだけです。
なのですが、自分のサーバに robots.txt は存在しないのに、ブラウザーでアクセスすると robots.txt が表示されるどうなっとんねん?
またAI先生にお尋ねすると、 robots.txt が存在しないときはwordpressが自動返答で引き渡しているという。
だから、wordpressが自動生成している robots.txt をテキストファイルに起こしたうえで、Disallow: /?replytocom= を追記して、新規 robots.txt を作成してFTPでアップロードとなりました。
次は、Google Search Console の設定-クロールのrobots.txtをクリックして

再クロールをリクエストして、あとは寝て待つだけでいいよね。

「cocoon設定」>「seo」>「headタグに挿入」
あとは…
アーカイブページ https://nagan.blog/hopewreck/post/2018/07/page/3/ とかが引っかかっているのは…
wordpress、「cocoon設定」>「seo」>「headタグに挿入」 のところで
「その他のアーカイブページをnoindexとする」にチェックがはいっていたからではないかと思う。
headタグに挿入の noindex に関するチェックを全部外しておいた。

次の課題、「クロール済み – インデックス未登録」
次は….
「クロール済み – インデックス未登録」ってやつ。件数が多いよね。

/feed/のやつは先に設定したやつで対策できているはずだから置いといて…
とりあえず、指摘されているURL記事を確認してみる。
https://nagan.blog/hopewreck/post/d8fe8d1c8014802c1327671ceddfaeb5/
の欄にある虫眼鏡アイコンクリックして…

えーと、このページに出てくる二つのURL
参照元ページ
https://nagan.blog/hopewreck/post/dd50ffd17be43023723ee5b485ea105f/
ユーザーが指定した正規 URL
https://nagan.blog/hopewreck/post/d8fe8d1c8014802c1327671ceddfaeb5/
は、どちらも存在しているんよね。
となると….
参照元サイトマップが検出されませんでした
のワードが問題ってことだ。
サイトマップ・・・。それって何?
ってのを今晩は追及してみよう。
ここまでで、自分の記録として作業した内容をそのまま書き込んで置いた。
はい、ブログ初診者がするような初歩でしくじっているってことですな。
頑張りませう。
コメント