コンテンツ ソースについて (Office SharePoint Server)
コンテンツとは、Web ページ、Microsoft Office Word 文書、ビジネス データ、電子メールのメッセージなど、すべてのクロール可能なアイテムです。コンテンツは、Web サイト、ファイル共有、または SharePoint サイトなどのコンテンツ リポジトリに存在します。コンテンツ ソースは、コンテンツのクロール方法およびコンテンツのクロール スケジュールを定義する設定を指定します。コンテンツ ソースは、クロールを開始するコンテンツ リポジトリのアドレス (開始アドレスと呼ばれます) を 1 つ以上を含みます。これらの設定は、コンテンツ ソース全体のすべての開始アドレスに適用されます。
既定のコンテンツ ソース
SharePoint サイトに含まれるコンテンツのみをクロールする必要がある組織では、追加のコンテンツ ソースを作成する必要はありません。Microsoft Office SharePoint Server 2007 は、初期展開中に既定のコンテンツ ソースを定義します。既定のコンテンツ ソースの名前は、"ローカルの Office SharePoint Server サイト" です。サーバー ファーム内のすべての Web アプリケーションの開始アドレスは、既定のコンテンツ ソースの一部として自動的に含まれます。このコンテンツ ソースは既定ではクロールされません。既定のコンテンツ ソース内のコンテンツのインデックスを作成するには、クロールを手動で開始するか、クロールを行うスケジュールを作成します。
新しいコンテンツ ソースを作成する
コンテンツがクロールされるときのクロールするコンテンツの種類、およびクロールの動作 (開始アドレスの名前空間内をクロールする深さや、許可するサーバー ホップ数など) を定義する設定を、コンテンツ ソースを作成するときに指定します。複数の種類のコンテンツ リポジトリをクロールする場合や、別のスケジュールでクロールするコンテンツ リポジトリがある場合は、追加のコンテンツ ソースを作成する必要があります。Office SharePoint Server 2007 は、共有サービス プロバイダ (SSP) ごとに最大 500 個のコンテンツ ソースをサポートでき、各コンテンツ ソースは最大 500 個の開始アドレスを含むことができます。追加のコンテンツ ソースを作成するタイミングの詳細については、「コンテンツのクロールを計画する (Office SharePoint Server)」の「コンテンツ ソースを計画する」セクションを参照してください。クロールの動作を構成する方法の詳細については、「クロールされるコンテンツの量を制限または増加する (Office SharePoint Server)」を参照してください。
コンテンツ リポジトリの種類
クロールできるコンテンツの種類は、コンテンツ ソースごとに 1 種類のコンテンツ リポジトリのみです。つまり、SharePoint サイトの URL を含むコンテンツ ソースと、ファイル共有の URL を含む別のコンテンツ ソースを作成できますが、SharePoint サイトとファイル共有の両方の URL を含む単一のコンテンツ ソースを作成することはできません。
以下の表に、Office SharePoint Server 2007 がクロールできるコンテンツ リポジトリの種類の一覧を示します。
コンテンツ ソースの種類 | 含まれるコンテンツの種類 |
---|---|
SharePoint サイト |
|
Web サイト |
|
ファイル共有 |
|
Exchange パブリック フォルダ |
|
Lotus Notes |
|
ビジネス データ (Enterprise Edition のみ) |
|
コンテンツの開始アドレス
各コンテンツ ソースは、クローラがコンテンツのリポジトリへの接続に使用する開始アドレスのリストを含みます。各コンテンツ ソースは最大 500 個の開始アドレスを含むことができます。複数のコンテンツ ソースを使用して同じアドレスをクロールすることはできません。たとえば、特定のコンテンツ ソースを使用してサイト コレクションとそのすべてのサブサイトをクロールする場合は、異なるコンテンツ ソースを使用してそれらのサブサイトの 1 つを別のスケジュールでクロールすることはできません。
コンテンツのクロール
コンテンツ ソースを使用して、手動でクロールを開始したり、選択したコンテンツ ソースをクロールするタイミングと頻度をスケジュールできます。コンテンツ ソースの一部のコンテンツを異なるスケジュールでクロールする場合は、そのコンテンツのために個別のコンテンツ ソースを作成する必要があります。パフォーマンスと管理性の理由から、使用するコンテンツ ソースを可能な限り少数にすることをお勧めします。 手動でクロールを開始する方法やクロールをスケジュールする方法の詳細については、 「コンテンツをクロールする (Office SharePoint Server 2007)」を参照してください。
認証
コンテンツ ソースに指定されている開始アドレスにクローラがアクセスするとき、クローラはそのコンテンツをホストするサーバーの認証を受け、アクセスの許可を受ける必要があります。 クローラによって使用されるユーザー アカウントには、最低でもコンテンツをクロールする読み取りアクセス許可が必要です。既定では、Office SharePoint Server 2007 は、既定のコンテンツ アクセス アカウントを使用し、サーバーの認証には NTLM を使用します。詳細については、「クローラの認証方法を構成する (Office SharePoint Server 2007)」を参照してください。
関連項目
概念
コンテンツのクロールを計画する (Office SharePoint Server)
ブログ投稿の内容を返すように検索を構成する (Office SharePoint Server 2007)
SSL サイトをクロールするためのクライアント証明書を構成する (Office SharePoint Server 2007)