HOME > アルゴリズムアップデート
このエントリーをはてなブックマークに追加

アルゴリズムアップデート

【公式発表】Googleがコンテンツの信頼性の評価方法を発表

2020年09月11日

Googleは2020年9月10日に公式サイトで「Googleはどのようにして信頼性の高い検索結果を提供しているのか?」"How Google delivers reliable information in Search"というレポートを発表しました。



このレポートによるとGoogleは検索ユーザーに誤った情報を提供しないようにするために3つのアプローチをとっているということです。

その3つのアプローチとは:

1、『当社は検索ユーザーが便利であり、信頼性があると思える情報を発見するランキングシステムをデザインするようにしている』

2、『このことを実現するために当社は数多くの検索機能を開発ました。それにより、ユーザーはわかりやすい情報を提供しているサイトだけでなく、保健機関や政府機関のようなオーソリティーのサイトに直接アクセス出来るようにしています』

3、『品質が高いサイトと役立つコンテンツのあるサイトが検索結果ページに表示されるようにするポリシーを掲げています』

です。

さらにこのレポートは次のようなことを述べています:

●『高度な人工知能であるBERTを使った言語解析機能により、スペルミスや、同義語を理解するようになっている』

●『しかし、このような高度な解析システムを用いても、誇張された言語や画像、不正確、低品質、または無益な言語や画像までは理解出来ない』

●『検索アルゴリズムは「シグナル」と呼ばれる手がかりを通じて、コンテンツの品質を理解しようとします。シグナルの一例としては、あるトピックにおいて多数の高品質なページが信頼できる情報源として特定のページにリンクを張っているか等があります』

●『当社は、様々な種類の品質に関するシグナルを考慮します。そして、それらのシグナル自体が正確かを確かめるために、多くのテストを実施しています。そのために当社では10,000人以上の検索品質評価者を用いており、彼らは集団的に何百万もサンプル検索をして検索結果の品質を評価しています。そしてその評価は当社が定めたE-A-Tという基準に基づいたものになっています』

●『検索品質評価者たちは、「検索品質評価ガイドライン」(Search Quality Rater Guidelines)という誰もが理解できる仕様に基づいて、サンプル検索結果をE-A-Tという基準に照らして評価します。』

●『ただし、検索品質評価者たちは直接検索結果を触るのではなく、彼らの成果はランキングアルゴリズムの改善のために役立てられます』

●『健康、金融、市民情報、危機情報に関するトピックにおいては特に専門家の情報であるかどうかとコンテンツの信憑性について深く検証します。当社は、権威性と専門性を示しているサイトは間違った、あるいは誤解を招くような情報を発信しない傾向があるということを学びました。そのためこれらのサイト上で見かけるシグナルを発見するシステムを構築出来れば信頼性の高い情報を提供し続けることが出来るでしょう。こうしたシステムをデザイン出来れば潜在的な誤報を含む低品質コンテンツに対しての防御になるはずです』

●『ほとんどの場合、当社のランキングシステムはオープンなWeb上にある適切で信頼性のある情報を発見することが出来ています。このことは特に、健康や危機情報を取り扱う場合に重要となります。しかし、これらの領域においては地方自治体、保健機関、選挙管理委員会から直接情報を収集することがあります』

●『例えば、Google検索では、検索結果ページ上にナレッジパネルを表示しています。ナレッジパネルには、医療の専門家による健康状態や症状に関する情報を直接表示することがあります。最近では、失業手当に関する検索が著しく増加しています。このニーズに対応するために行政機関と協力して受給資格や受給手続きについての情報を表示するようにしています。さらに長年の間、選挙の投票方法や、投票所に関する情報も直接表示するようにしています。この種の情報は、状況が急速に変化している時期において発見するのは簡単なことではありませんが、当社のシステムにより人々に必要とされる重要情報を確実に入手出来るようになってきています』

●『ユーザーが検索する時には、必ずしも簡単な答えを求めているとは限りません。複雑なトピックを検索する時はそうした傾向が高いものです。他の場所で聞いたことがある情報を検索する時は、他の人達がそのことについてどのような意見を述べているかを知りたがっているということも当社は認識しています。
そのような時は、ユーザーが情報をより良く理解するために信頼できる情報源とその事柄の全体像を知ることが出来るよう努めています。
例えば、Web検索、ニュース検索、画像検索においてはファクトチェックがしやすいようにサイト運営者がファクトチェックマークアップツールを活用出来るようにしています。
何年もの間当社はユーザーが異なった見方や意見を知ることが出来るようにGoogleニュースとWeb検索では多種多様なサイトをカバーするようにしています』
【参考情報】 ファクト チェック

●『当社ではナレッジパネルや、強調スニペット、オートコンプリート等の検索機能を提供しています。それらは独特な形に情報を強調、整理する他、ユーザが知りたがっていることを予測します。これらの情報を適切に提供するため我々は情報の品質に対して非常に高い基準を持つようにしています』

●『これらの全ての機能を用いることにより、当社は自動ランキングシステムをデザインしています。しかしそれはいつも完璧と言えるものではありません。そのためその自動システムがうまく機能しない場合は、担当者が当社の編集方針に基づいて人的な干渉をすることがあります。』

Googleはこのレポートで非常に多くの重要ポイントを発表していますが、要約すると:

1、Googleは検索結果から信頼性の低いサイトを排除しようとしている

2、特に、健康、金融、市民情報、危機情報に関するトピックに関するページを厳しくチェックしている

3、信頼性があるかを見極めるために独自のガイドラインに基づいてアルゴリズムを改善している

4、アルゴリズムで認識できない不正確な情報は、人的資源を用いて発見する体制を敷いている

5、緊急時に必要とされる情報は政府機関などと連携して提供している

という5つのポイントになります。

Google検索の利用率の増加と、新型コロナウイルスの影響によりこれまで以上にGoogleはコンテンツの信憑性に目を光らせるようになってきています。

おそらく次にGoogleが実施するアルゴリズムアップデートではこの点に大きなメスを入れる可能性が十分にあります。

今回の発表は、その予告の可能性があります。

私サイト運営者にはこれまで以上に発信する情報の正確性を徹底する必要があります。

企業サイト運営者はもちろんのこと、個人サイト運営者やアフィリエイターは、誇大広告的なテキスト表現や画像はもちろんのこと、強引な宣伝、集客手法を使うことは避けなくてはなりません。

それを怠った時、Google検索とその検索結果を表示しているYahoo検索という非常に太い集客パイプが確実に切断されることになるはずです。

Googleの検索結果が2020年8月11日に変動!原因はGoogle検索の不具合と判明

2020年08月12日

2020年8月11日にGoogleの検索結果が大きく変動しました。非常に多くの方から協会にも問い合わせが来ていました。
最初はコアアップデートか、人工知能アルゴリズムのBERTアップデートの影響ではないかとも思われましたが、翌日8月12日にGoogleは公式のTwitterで次のような発表をしました。

『月曜日に当社のインデックスシステムに問題が生じたことを検知しました。その問題によりGoogle検索の検索順位が変動しました。すでに原因を特定し不具合は修復されました。』
"On Monday we detected an issue with our indexing systems that affected Google search results. Once the issue was identified, it was promptly fixed by our Site Reliability Engineers and by now it has been mitigated. Thank you for your patience!"

【情報元】 Google公式Twitter

不具合が起きたのは約1日だけだったためどれほど検索順位が変動したのかを捉えることは出来ませんでしたが、外国語のサイトが上位表示していたり、関連性の低いサイトや質が低いサイトが上位表示していたということです。

昨年4月にもGoogleの検索システムには不具合が生じてその様子が報じられました。

Googleは毎年3ヶ月おきくらいの感覚でアルゴリズムアップデートか、インデックスアップデートを実施します。

それらのタイミングのほとんどがホリデーシーズンと重なり、1月、3月、6月、8月か9月、11月のことが多いため、今回日本のお盆休みのある8月にアップデートが実施されたと思った方も多いと思います。幸いにして今回はGoogle検索のインデックスの不具合が原因で、復旧も早かったですが、例年のペースだと8月か9月にアルゴリズムアップデートか、インデックスアップデートが実施されることが予想されます。

そもそも何故今回不具合が生じたのかを考えなくてはなりません。最も考えられる原因は、近い将来何かを検索アルゴリズムに追加するか、既存のアルゴリズムを変更しようとしているのでは無いかということです。

それが起きる前に万全の準備をしてください。

これらのアップデートに対する事前の対策については:
に多数アップしていますのでご覧下さい。

Googleが要求する「コンテンツと品質に関する条件」とは?

2020年06月30日

前回の記事に続いてGoogleが発表したサイト評価リストを検証します。Googleのサイト評価リストの中で【コンテンツと品質に関する質問】は数が多く、そのひとつひとつの内容はとても濃いです。

Googleが要求するコンテンツと品質に関する条件を満たすことによりコアアップデートによって順位が落ちたサイトは復旧を目指せるようになります。

コンテンツはそのトピックに対して相当な、完全な、あるいは包括的な説明を提供しているか?


最近のGoogleは、「包括的」という言葉をよく使うようになりました。「網羅性」と言い換えてもかまいません。

例えば「アップルウォッチ メリット」というキーワードで上位表示させたいとしましょう。
 
アップルウォッチにもメリットはたくさんあるでしょうが、よそのサイトがメリットを10くらい書いているとします。それなのに、今から新規作成するサイト内に2〜3しかメリットを書かなかったらどうなるでしょうか? 



これは「中途半端」な状態でしょう。少なくともGoogleの判断基準においては「包括的」ではないのです。

Googleは「書くなら徹底的に書け」と要求しているのだと考えるとわかりやすいのではないでしょうか。Googleもユーザもどちらも、中途半端を好まないのです。

コンテンツは見識ある分析、または至極明白に興味深い情報か? 


「見識ある分析」とは? Googleはどんな基準で、各ページ内の分析に「見識がある」「見識が足りない」と判断するのでしょうか? 

1.科学的根拠があるか? 
2.法律的に問題が無いか? 
3.倫理的に問題は無いか(差別、特定の個人や企業団体への攻撃、社会通念)? 
4.論理的に説得力があるか? 
5.正確性が高いか? 


例えば「このドリンクを飲んだら、がんが治ります」なんて文章は、1.や2.に反します。

3.だけ異色かもしれませんが、たとえば「Aという実験をするために部下3名をいじめてみました」なんてことを書いたら明らかに倫理的に問題があるとみなされるでしょう。

4.については「UFOが飛んでいるのが見えました。本当にすごかったです」といった脈絡のない文章、個人の妄想と大差ない文章が該当します。

5.については、誤字脱字はもちろんのことですが「2018年に起こった出来事を2019年の日付で書いてしまった」といった場合が該当します。

また、Googleでは少数派の意見はなかなか上位表示できなくなっています。多数派・主流派の意見のほうが優遇される仕組みになっているのです。

例えば「NHKの受信料」については現在、否定的な意見が強い時代です。その流れに反してNHKの存在価値を説明しながら受診料を払うことの大切さを唱えても、主流派とはみなされません。



結果として、その主張を書いたページが上位に入ることは並大抵のことではありません。

そのほか、以下のような風潮がみられます。

・西洋医学 >東洋医学(代替医療)
・大手マスメディアの見解 > 陰謀論


東洋医学(代替医療)のサイトよりも西洋医学のサイトのコンテンツが上位表示されやすく、陰謀論のサイトよりも大手マスメディアのサイトのほうが上位表示されやすいという傾向が高まってきています。

ちなみにGoogleの悪口を言っているサイトやGoogleを批判するサイトも、上位には表示にくい傾向があります。これはGoogleが意図的に自社の批判しているサイトの上位表示を阻んでいるという意味ではありません。そうしたサイトが上位表示されにくいのはそれが主流派の意見ではないからです。Googleを好きな人達が主流はであり、そうでない人たちはマイノリティーだからです。マイノリティー向けの情報はニーズが少ないので上位表示しにくいというメカニズムが働いているのです。



実はGoogleがとても恐れている検索エンジン企業があります。世界で唯一、Googleを脅かす程度のシェアを伸ばしている企業です……しかしGoogleで探してもその企業の情報はなかなか出てきません。



検索結果はかなりGoogleと似ており、しかも表示速度も遅くありません。Googleと近い技術を持っている様子がうかがえます。

この企業はプライバシーを侵害していないようですが、Googleはさまざまなやり方でプライバシーを売って金儲けをしています。少なくとも、個々人のデータ(好き嫌い等が、そのよい例でしょう)を取得して、それに合わせた広告を出しています。

これがGoogleの事業モデルの根幹なのですが、もしこれが破壊されたらGoogleは崩壊の危機に瀕するでしょう。DuckDuckGoはまさにそれを破壊し得る存在なのです。

このように、トップページではっきりと「私たちはあなたを広告で追跡しません」と主張しています。



これはWeb広告業界全体にとって、脅威となるアピールです。

さて、DuckDuckGoの情報をGoogleが意図的に消しているといった証拠はありません。少なくともGoogleを批判するページはめったに出ないようになっていますが。
これも恐らくDuckDuckGoの知名度がまだまだ低いので、ニーズが少ないとGoogleのアルゴリズムが判断しているからでしょう。

では「至極明白に興味深い情報」に関して、Googleの定義をここで再確認しておきましょう。

コンテンツのテーマが、以下の5項目を満たすことが大事です:

・読者ニーズがあるものである
・どこにでもある情報ではなく、比較的新しい情報にあふれている
・新規性がある
・トレンドに乗っている情報ばかりである
・時代性を反映している(時代遅れではNG)


コンテンツが他の情報ソースから得られたものである場合は、単にコピーしていたり、リライトしただけのものではなく、相当量の付加価値と独自性を提供したものになっているか?


私がクライアントのサイトの競合ページを観察していてわかったこととしては、「ページ内のコンテンツの約80%がオリジナルだと上位表示される傾向が高い」というものがあります。



もう少し詳しく言うと・・・

1、他のサイトからの引用だけでなく、そこから何が見て取れるのか? 発見した点をメインコンテンツにする


情報の収集は、本来ならとても手間暇がかかるものです。しかしその手間暇をできるだけ軽減してあげるような、親切なサイトづくりが評価されるのです。

2、言葉の順番や言い回しを変えるだけのリライトはGoogleのアルゴリズムによって時間の問題で見抜かれてしまい、そのページは上位表示できなくなる


小手先のリライトではGoogleを騙せなくなりました。安直なリライトでつくられたWebページには「付加価値」が皆無です。それをGoogleは見逃しません。

他のサイトにはない付加価値(筆者の意見・見解)や独自性(他のサイトにない、独自の意見・見解)が、相当量入っていないといけないのです。

ページの見出し、または表題がそのページのコンテンツを正確に描写し、読者の理解を助けるまとめになっているか? 


1、タイトルや見出しの中身の、整合性・正確性


ページのタイトルや冒頭の大見出しは、そのページの中身とかけ離れているとNGです。 

ここで大事なのは、以下の内容を軽視しないということです:

・タイトル(タイトルタグの中身)
・大見出し・小見出し


そして上記の各内容と、ページのコンテンツ全体との間にギャップが生じないようにしましょう。



記事全体のまとめが「大見出し」としたら、各ブロックのまとめが「中見出し」です(さらにその下の「小見出し」があることだって、多いでしょう)。必ず書きましょう。

大見出し・中見出し・小見出しは、それぞれh1タグ・h2タグ・h3タグが用いられることがふつうでしょう。

以下のような頻度で使うとよいでしょう。

・h1:1回だけ
・h2:数回
・h3:数回


実はこの事を解説したページが全日本SEO協会のブログにあります。

「大見出し」で検索すると第1位に表示されています。


2、タイトルや見出しの中身が、ユーザを誘導する力を持っているか?


タイトルタグに書かれた文言が、以下のどちらかにあてはまると、ユーザがそのページを訪れたいとはなかなか思わないものです。

・稚拙なフレーズで埋められている場合
・単なる単語の羅列で、無味乾燥な場合




検索結果ページに並んだ各ページへのリンクのクリック数をGoogleは常に集計しているといわれています(どのくらいクリックされているのか、クリック率は何%なのかが集計されています)。クリック率が高いページは、高評価を与えられて順位が上がりやすくなります。

自社サイトのクリック率については、サーチコンソールでいつでも確認できます。
「検索パフォーマンス」という欄で確認出来ます。



「順位は悪くない。しかしクリック率がイマイチ」というページが出てくることもあるでしょう。この場合は「タイトルが魅力的でない」といった理由が考えられます。

ページの見出し、または表題が誇大表現ではなく、かつ不必要に感情を揺さぶるものではないか?


これは、上記の「ページの見出し、または表題がそのページのコンテンツを正確に描写し、読者の理解を助けるまとめになっているか?」と似ています。Googleは、検索結果ページの各リンクのクリック率と同時に、クリック後の滞在時間も集計していると言われています。



その滞在時間(秒刻みで集計されています)が、基準値より短いとマイナス評価の一因になります。

何故なら、滞在時間が短い理由は次のいずれかであると解釈するからです:

・タイトルタグの内容が誇大表現である
・ページ全体、サイト全体の品質に欠陥がある

さて、タイトルタグは、ユーザがクリックしたくなるように魅力的に書かなくてはならないわけですが、だからといってオーバーな表現が入ってしまうのも命とりになります。

例えばGoogleの検索結果ページ上に、「世界一周〜」と書かれているのに、実際にサイトを見た時にそのページの著者がたくさんの国々を周遊したわけではないことがばれてしまうと、ユーザは途中で読むのをやめてしまう可能性が生じます。そしてそれが続くと、平均の滞在時間は確実に短縮するはずです。

自らがユーザーの立場としてそのページをお気に入りに入れたり、友人にシェアしたりおすすめしたくなるコンテンツか?


これは、早い話「自分が、そのページを心から好きになれるか」ということです。実はGoogleは検索ユーザが「お気に入り」に入れたページの数も集計していると言われています

これはSEM Rushという会社が発表したデータです。



検索順位決定要因のランキングですが、第1位は「直接訪問」です。ブラウザから「直接」来ているケースを集計したものですが、このような「お気に入り」に含まれるサイトは、とても気に入られていることは間違いありません。

したがって、このような直接訪問の頻度が高いサイトは、Googleに人気サイトと認識されます。結果として順位が上がる一因になっていくのです。

そのコンテンツは印刷された雑誌や百科事典、書籍の中で紹介されてもおかしくないものか? 


これは、「すぐにでも出版・刊行できるレベルに仕上がっているか」という意味でしょう。

以前から、書籍や雑誌くらいの完成度を持つサイトがいずれ必要になっていくのではないか? と言われていましたし、実際に最近はそうなりつつあります。
書籍や雑誌くらいの完成度を持つサイトであるべきだということをGoogle自ら宣言するようになったのです。

以上が、Googleが要求する「コンテンツと品質に関する条件」の詳細です。

どうでしたでしょうか?Google検索で上位表示するための具体的な方法がみえてきたはずです。

全てで無くても良いです。完璧でなくても良いです。しかし出来るところから着実にこうしたレベルのページ造りを目指すべきです。

それが出来た時にあなたのサイトは安定的にGoogleで上位表示を出来るようになるはずです。
このエントリーをはてなブックマークに追加
                    
鈴木将司の最新作品
プロフィール
一般社団法人 全日本SEO協会 代表理事

鈴木将司
2020年 09月 >>
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      
最新記事