<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>devkuma – Robots</title>
    <link>https://www.devkuma.com/jp/tags/robots/</link>
    <image>
      <url>https://www.devkuma.com/jp/tags/robots/logo/180x180.jpg</url>
      <title>Robots</title>
      <link>https://www.devkuma.com/jp/tags/robots/</link>
    </image>
    <description>Recent content in Robots on devkuma</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>jp</language>
    <managingEditor>kc@example.com (kc kim)</managingEditor>
    <webMaster>kc@example.com (kc kim)</webMaster>
    <copyright>The devkuma</copyright>
    
	  <atom:link href="https://www.devkuma.com/jp/tags/robots/index.xml" rel="self" type="application/rss+xml" />
    
    
      
        
      
    
    
    <item>
      <title>robots.txt</title>
      <link>https://www.devkuma.com/jp/docs/robots/</link>
      <pubDate>Sat, 17 Apr 2021 08:32:00 +0900</pubDate>
      <author>kc@example.com (kc kim)</author>
      <guid>https://www.devkuma.com/jp/docs/robots/</guid>
      <description>
        
        
        &lt;h2 id=&#34;本来の検索エンジンの動作方式&#34;&gt;本来の検索エンジンの動作方式&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;インターネット検索エンジン排除標準(Robots Exclusion Protocol)である。&lt;/li&gt;
&lt;li&gt;クローラーというロボットがインターネットを巡回し、サイトの情報を収集する。&lt;/li&gt;
&lt;li&gt;インデクサーはクローラーが収集した情報を分析する。&lt;/li&gt;
&lt;li&gt;分析されたデータを基に、検索エンジンごとのアルゴリズムに従って検索結果を返す。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;robotstxt-とは&#34;&gt;robots.txt とは？&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;robots.txt&lt;/code&gt; は、クローラーに「クロールするページ」または「クロールしないページ」を知らせるテキストファイルである。&lt;/li&gt;
&lt;li&gt;そのドメインの最上位ディレクトリに公開される。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;robots.txt&lt;/code&gt; はまだ勧告であり、必ず守る義務はない。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;robotstxt-形式&#34;&gt;robots.txt 形式&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;User-agent: 検索ボット名&lt;/li&gt;
&lt;li&gt;Allow: アクセス許可設定(Googlebot のみに適用可能)&lt;/li&gt;
&lt;li&gt;Disallow: アクセス遮断設定&lt;/li&gt;
&lt;li&gt;Crawl-delay: 次回訪問までのディレイ(秒)&lt;/li&gt;
&lt;li&gt;Sitemap: サイトマップ指定&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;robotstxt-使用例&#34;&gt;robots.txt 使用例&lt;/h2&gt;
&lt;p&gt;&lt;strong&gt;すべての検索ボットにすべての文書へのアクセスを許可&lt;/strong&gt;&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;background-color:#f8f8f8;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;User-agent: *
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;Allow: /
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;&lt;code&gt;*&lt;/code&gt; はすべてのロボットを意味し、&lt;code&gt;/&lt;/code&gt; はすべてのディレクトリを意味する。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;すべての検索ボットにすべての文書へのアクセスを遮断&lt;/strong&gt;&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;background-color:#f8f8f8;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;User-agent: *
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;Disallow: /
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;&lt;strong&gt;特定ディレクトリへのアクセスを許可&lt;/strong&gt;&lt;/p&gt;
&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;User-agent: Googlebot
Allow: /foo/bar/
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;&lt;strong&gt;特定ディレクトリへのアクセスを遮断&lt;/strong&gt;&lt;/p&gt;
&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;User-agent: Googlebot
Disallow: /foo/bar/
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;&lt;strong&gt;Googlebot だけ許可し、残りはすべて遮断&lt;/strong&gt;&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;background-color:#f8f8f8;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;User-agent: Googlebot
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;Allow: /
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;User-agent: *
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;Disallow: /
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h2 id=&#34;サイト負荷パフォーマンスの観点&#34;&gt;サイト負荷(パフォーマンス)の観点&lt;/h2&gt;
&lt;p&gt;クローラー巡回によってサイト負荷が増加する場合、&lt;code&gt;robots.txt&lt;/code&gt; で重要ではない大量のコンテンツをクローラー巡回から除外し、サイト負荷を減らし、重要なコンテンツへの巡回効率を向上させることができる。&lt;/p&gt;
&lt;p&gt;重要なコンテンツと重要ではないコンテンツを区別することは、SEO とサイト負荷の面でもよい。&lt;/p&gt;
&lt;p&gt;重要ではないコンテンツには次のようなものがある。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;検索エンジンにインデックスしなくてもよいページ&lt;/li&gt;
&lt;li&gt;価値が低いコンテンツページ&lt;/li&gt;
&lt;li&gt;同一コンテンツの複数ページ&lt;/li&gt;
&lt;li&gt;サイトに入れた広告のランディングページ&lt;/li&gt;
&lt;li&gt;限定された人だけに公開したいページ&lt;/li&gt;
&lt;li&gt;管理システムファイル&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;セキュリティ観点&#34;&gt;セキュリティ観点&lt;/h2&gt;
&lt;p&gt;&lt;code&gt;robots.txt&lt;/code&gt; に「クロールしたいページ」または「クロールしないページ」を設定すると、限定された人だけに公開したいコンテンツが見えてしまうことがある。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;robots.txt&lt;/code&gt; に管理システムファイルや限定公開ページを設定すると、検索エンジン結果には表示されないが、&lt;code&gt;robots.txt&lt;/code&gt; には公開されるため直接見えてしまう。したがって、セキュリティ上重要な管理ファイルや特定の限定された人だけに公開したいページには、ログイン認証や IP アドレス制限など確実なアクセス制限を設ける必要がある。&lt;/p&gt;
&lt;h2 id=&#34;参照&#34;&gt;参照&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href=&#34;https://developers.google.com/search/docs/advanced/robots/intro?hl=ko&#34; target=&#34;_blank&#34; rel=&#34;noopener&#34;&gt;Google 検索セントラル | Robots.txt 紹介&lt;i class=&#34;fas fa-external-link-alt&#34;&gt;&lt;/i&gt;&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;https://namu.wiki/w/robots.txt&#34; target=&#34;_blank&#34; rel=&#34;noopener&#34;&gt;Namu Wiki: robots.txt&lt;i class=&#34;fas fa-external-link-alt&#34;&gt;&lt;/i&gt;&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

      </description>
      
      <category>web</category>
      
      <category>SEO</category>
      
      <category>robots</category>
      
    </item>
    
  </channel>
</rss>
