スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

サーチエンジンはURLの大文字と小文字を区別する

http://www.suzukikenichi.com/blog/url-is-case-sensitive/より転記

アルファベットの大文字と小文字が混在したファイルを、すべて小文字だけに統一したら、GoogleのPageRankがすべて「0」になってしまった。

これって一時的なもの?
それとも、Googleが別ページとして認識してしまったから?

答えは、後者です。

WebmasterWorldで見かけたスレッドからです。

大文字と小文字を区別するのは、Googleの仕様ではなくコンピュータの仕様です。
※ちなみに英語では、大文字を「upper case」、小文字を「lower case」、大文字と小文字を区別することを「case-sensitive」と表現します。

インターネットで利用されるウェブサーバーのプラットフォームは、Apache(アパッチ)とIIS(アイアイエス)でほぼ占められています。

Apacheは、UNIX(ユニックス)やLinuxで使われるウェブサーバー製品です(Windows移植版もあり)。

UNIXやLinuxは、大文字と小文字のファイルやディレクトリ(フォルダ)は、同じ名前であっても別物として取り扱います。

一方、IIS(正式名称は、Internet Information Services)はMicorsoftのWindowsで稼動するウェブサーバー製品です。

Windowsは、ご存知のとおりファイルやフォルダの大文字・小文字を区別しません。

個人で利用するOSとして、Windowsを使っている人がほとんどでしょうから、大文字か小文字かを意識することはめったにないでしょう。

しかし、Googleなどのサーチエンジン企業は、Windows(IIS)は使っていないはずです(MSは、自社のIISだけではなくApacheも使っているらしい)。

そして、おそらく使っているOSは大文字と小文字を区別するでしょう(IISも大文字と小文字を区別するように設定変更できます)。

また、WWW(World Wide Web)で利用される技術の標準化をすすめる団体の「W3C」でも、大文字と小文字を区別するように推奨しています。

URLs in general are case-sensitive (with the exception of machine names). There may be URLs, or parts of URLs, where case doesn’t matter, but identifying these may not be easy. Users should always consider that URLs are case-sensitive.

“一般的にURLは大文字と小文字を区別する(機械の名前は例外)。大文字・小文字が問題にならないURLやURLの一部があるが、違いを識別するのは困難である。ユーザーは、大文字・小文字を常に意識すべきである”

僕はHTML初心者の頃(今でも、ぜんぜん上級者ではないw)、画像の拡張子が大文字の「.JPG」になっているのに、HTMLコードで小文字の「.jpg」を指定していて、ファイル名やパスは合っているのに表示されなくて、途方にくれた記憶があります。(あなたもありませんか?)

えっと、グダグダと蛇足をたくさん書きましたが、この記事で伝えたかったことを整理します。

URLの大文字・小文字は名前が同じであっても、別物として区別されます。
たとえば、index.html、Index.html、INDEX.html、index.HTMLはすべて違うファイルとして認識されます。

検索エンジンにとっては、すべて異なるウェブページです。

ファイル名・ディレクトリ名の大文字・小文字は、必ず統一しましょう。
一般的には、小文字でそろえる場合が多いです。
スポンサーサイト

グーグル、Diversityアルゴリズム&CLIRサービス

http://www.suzukikenichi.com/blog/google-new-feature-diversity-and-clir/より転記

GoogleのSearch QualityチームのVice President、Udi Manber(ウディ・マンバー?)氏へのインタビューが、Popular Mechanicsで公開されました。

注目すべき点を、ピックアップします。

Googleは昨年2007年に実に450以上にものぼるアルゴリズムの改良を行いました。
単純計算で、1日1つはアルゴリズムに変化があるということですね。
(もちろん、まとめて実行しているでしょうが)

Googleは検索結果を、人の手で変更することはしません。
4位に位置するサイトが1位だと判断しても、決して手動で変更することはなく、アルゴリズムに反映されるようにします。

この2点に関しては、SEMリサーチさんが「スパムサイトは手動で削除されることがある」という補足と共に解説しています。

Googleは、アルゴリズムの改良のために日々実験を繰り返していて、このインタビューの前の週にもリアルタイムで、新しいアルゴリズムの試験を実施しました。

ごく限られたユーザーに対してだけ、新しいアルゴリズムを採用し、通常の検索結果と比較します。

この実験では、「Diversity」要素を組み込んだアルゴリズムを調査しました。
「Diversity」というのは、日本語に直訳すると「多様性」という意味になります。

「Diversity」が具体的にどういったことを指すのかは言及していませんが、検索キーワードに直接現れていない隠れているユーザーの意図を、察知することだと推測されます。

新アルゴリズムが成功した事例として、「New York Times address」という検索を引き合いに出しています。

普通に考えたら、「ニューヨークタイムズの住所」を調べる検索と判断しますが、多くのユーザーが調べたのは、実験の前の日に「ニューヨークタイムズで報じられた何かの住所」を調べる検索だったようです。

Diversityを考慮に入れた新しいアルゴリズムと、Fresshnessを考慮に入れたアルゴリズムは、うまく機能しました。

多種多様なユーザーの検索から、真の要求を汲み取るDiversityアルゴリズムが実装されれば、タイトルタグやHタグがどうとか、バックリンクがどうとか、ましてやキーワード出現率なんてものは、用を成さなくなりそうですね。

またGoogleは、より適切な検索結果を提供するために他のユーザーの検索データも利用しています。
ツールとしても提供していて、検索結果ページの上下に「関連検索」として、検索キーワードと関係性の高いキーワードの組み合わせが表示されます。
これは、ご存知ですよね。

最後は、新しいGoogleのサービスです。

その名は、「CLIR(Cross Language Information Retrieval)」と言います。

用語をうまく日本語に訳すのは難しいのですが、「言語の違いを飛び越えて情報を取得する」仕組みです。

検索結果を別の言語に訳してしまいます。
つまり、もしあなたが英語が分からなくても、英語のサイトを訳して情報を提供してくれるのです。
今のところ、12カ国の言語で準備が進められています。
Google Translateの機能を利用するとのこと。

ブログヤフーグーグルSEO対策ドットコムさんの言う、「ユニバーサルキーワード」の時代が、本当に訪れそうです。

現状では、ほとんどの機械翻訳サービス・ソフトの質は高いとは言えません。
ですが、きれいな(文法的に整っている)文章なら、かなり的確に訳してくれるようです。

ブログヤフーグーグルSEO対策ドットコムさんによれば、たとえばNASAのサイトは、ほぼ完璧な日本語に訳されるそうです。

実際私は無料翻訳機を毎日使うのでわかるのだが、無料翻訳機の性能は日々進化している。特にNASAのようなサイトは綺麗な文章だからなのか、NASAのサイト運営者が翻訳しやすい文章にしているせいか、非常にユーザーにやさしいサイト作りをしている。そのためNASAのホームページは翻訳ソフトによってはほぼ完璧な日本語変換で見れるのである。

日本人ユーザーだけではなく外国人ユーザーの検索も視野に入れるのなら、「美しい日本語」でコンテンツを作成しておいたほうが良さそうですね。

となると親しみやすい口語調よりも、模範的な言葉を使う文語調の方が、検索エンジンには優しいのでしょうか?
堅苦しい文章は、検索エンジンには好かれそうですが、読者離れを引き起こしそうですね。(笑)

インタビューを読み終わった感想として、「今せせこましくやってるSEOは、あっという間に無意味になってしまいそう」、そんな気がしました。

アウンコンサルなど調査、検索シェアでPCはYahoo!が圧倒的、携帯はGoogleと互角

http://web-tan.forum.impressrd.jp/n/2008/04/15/3006より転記

検索エンジンマーケティング(SEM)ビジネスのアウンコンサルティングは4月15日、モバイルコンテンツのインデックス、ポイント交換事業のポイントオンと共同で行った「携帯電話におけるインターネットおよび検索エンジンの利用状況のアンケート調査」の結果を発表した。最も使う検索エンジンは、PCではYahoo!が58%と半数を超え、続いてGoogleの38%、その他4%。携帯電話では、トップは PCと同じYahoo!モバイルだが比率は下がり35%。2位には各キャリアのメニュー検索が入り27%。Googleモバイルは3位の22%だった。

携帯電話で使う検索エンジンで、キャリアの検索を利用している層のうちauは必然的にGoogle、ソフトバンクはYahoo!を使うことになるため、これを加味して再集計すると、Yahoo!モバイルが40%、Googleモバイル35%となる。NTTドコモが4月1日にGoogleを採用したため、現在ではYahoo!モバイルとGoogleモバイルの差はほとんどなくなり、Yahoo!が圧倒的なPCの検索シェアと、携帯では異なる結果となった。

検索以外での携帯サイトの探し方としては、ケータイメール18%、ケータイ広告17%、PC16%で、キャリアの公式メニューが12%。新聞・チラシの7%、ネット上のクチコミ7%、テレビ6%、駅や電車の広告4%より、キャリアの公式メニューの利用率の方が高かった。調査は今年3月下旬に携帯電話サイトのアンケートフォームからの入力形式で実施、9098人が回答。サンプルとして5600人(15~49歳の5歳刻みで各800人ずつ、男女各計 2800人)を抽出して集計、分析した。キャリア別ではNTTドコモが41%、au38%、ソフトバンク21%。

アウンコンサルティング
http://www.auncon.co.jp/

セプテーニH、SEO2位のパワーテクノロジーを持分法適用会社に

http://japan.cnet.com/marketing/story/0,3800080523,20371221,00.htmより転記

セプテーニ・ホールディングスは4月10日付で、SEO(検索エンジン最適化)サービスで業界2位のパワーテクノロジーの株式を15.8%取得し、持分法適用関連会社にした。これにより、セプテーニHグループが手がけるSEO事業の規模は、業界首位のフルスピードに次ぐ規模となった。

 パワーテクノロジーの筆頭株主はこれまで、同社株式を29.9%保有する創業者で会長の中島正三氏だった。今回、中島氏の保有株のうち52.8%の株を取得したことにより、セプテーニHが新たに筆頭株主となった。中島氏は14.1%の株式を保有する第3位の大株主となった。また、セプテーニHの連結子会社でセプテーニ・アライアンス・ファンドはすでに7%の株式を保有する大株主。

 セプテーニHは今回の株式の取得金額を明らかにしていないが、数億円規模と見られる。

 パワーテクノロジーの2008年3月期は、売上高8億2700万円、経常利益3億1500万円となる見通し。セプテーニHはパワーテクノロジーを持分法適用関連会社に加えることで、セプテーニHグループのSEO事業は単純計算で年間12~3億円の売り上げ規模となる。セプテーニHとしては一気に業界2位の規模となり、パワーテクノロジーとしては年間16~7億円程度で業界首位のフルスピードとの距離を縮めることにつながる。

 SEOは一般的に粗利率が7割前後で、利益率が高い集客支援サービス。セプテーニHは今回の件について「SEOは今後の成長市場で、同事業の強化は収益力の向上にもつながる」(IR担当)とコメントしている。

 一方、パワーテクノロジーは「これにより株式公開がしやすくなる。今期(2009年3月期)は利益倍増を目指し、2009年秋をメドに株式公開する計画」(中島氏)としている。また、経営陣変更の可能性については「現体制のまま。今のチームで新規事業展開や既存事業拡大のスピードをさらに加速させる」とした。

 設立から通期で黒字が続く創業者が大量に保有株を手放すのは珍しいが、複数のネット業界関係者は「未上場で利益を出しているベンチャーの大株主が株式売却による現金化と継続保有を半々に分けることは、上場後にどれだけの値が付くか分からない2008年の市場環境を考えれば理解できる決断」と話していた。

土日も休まず更新することによる検索エンジン対策

http://japan.cnet.com/blog/jweb-seo/2008/04/05/entry_27000253/より転記


どのサイトにも言えることですが、会社でインターネットを利用している方が多いため、土日祝日のアクセス数は平日よりも少なくなります。
土日は競合サイトが少ない

ビジネスブログは土日は更新されないことがほとんどです。個人ブログでも土日も含め毎日更新しているサイトはすくないです。

更新されないサイトやブログが多いということは、競合するサイトが少ないということです。

閲覧者の絶対数が少ないことは事実ですが、ビッグサイトが競合となるキーワードでSEO対策しているサイトにとっては、土日祝日がある意味チャンスとなります。

土日に記事を作成しても検索エンジンにインデックスされるのが、平日になってからというのでは、あまりチャンス効果は見込めません。基本的なことですが、検索エンジンのインデックスを早めるために下記を実施しましょう。

* WPやMTなどのCMSブログの利用
* 既にインデックスされているページからリンクを張る
* ソーシャルブックマークの利用
* 更新頻度を上げる

はてなを除くソーシャルブックマークについては、nofollow属性がついているためSEO効果は無いのですが、ソーシャルブックマーク経由でアクセスしてくれた方が、自ブログで紹介ししれくれることによりインデックスされるという可能性はあります。
検索エンジンは年中無休

ふつうは閲覧者が少ない日は、更新も休みたいと思うところですが、検索エンジンは常に私たちのサイトを監視しています。検索エンジンに更新頻度が高いサイトであることを認識させ、インデックスをより早めるためには、日ごろの更新頻度も重要な要素となってきます。

毎日更新されているサイトと、年に数回しか更新されないサイトとでは、インデックスの早さも異なってきます。

土日に休みためには平日のうちから記事を作成しておき土日にアップするか、無料ブログの場合には投稿日時を指定できる機能を備えたものもあります。

日ごろ記事を早く書くためにはネタ帳も役に立ちます。ネットサーフして気になる記事をブックマークしておいたり、気になるキーワードをメモ帳にでも保存しておけば、効率よく更新することができると思います。

年末年始やゴールデンウィーク、お盆なども通常のサイト更新は止まります。他サイトとの差別化を図る意味でも、みんなが休んでいるときにこそ更新すべきなのです。
プロフィール

HyperTurbo27

Author:HyperTurbo27
FC2ブログへようこそ!

最近の記事
最近のコメント
最近のトラックバック
月別アーカイブ
カテゴリー
ブロとも申請フォーム

この人とブロともになる

印刷画面(ボタン付)
by genshoku
ブログ内検索
RSSフィード
リンク
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。