IBM WebSphere Portal 8.5: Assistência ao utilizador para administradores

Criar uma origem de conteúdo

Ao criar uma nova origem de conteúdo para um conjunto de procura, essa origem de conteúdo é incluída na sequência de hiperligações e o conjunto de procura é preenchido com documentos dessa origem de conteúdo. Pode determinar a localização em que índice efectua a sequência de hiperligações e quais as informações que obtém.

Procedimento

  1. Faça clique em Nova origem de conteúdo na página Abrir conjuntos de procura. A portlet Gerir procura apresenta a página Criar uma nova origem de conteúdo.
  2. A partir do menu Tipo de origem de conteúdo, pode seleccionar as seguintes opções:
    Sítio da Web
    Seleccione esta opção para todos os sítios remotos, incluindo sítios da Web e sítios do portal remotos. As páginas anónimas apenas podem ser indexadas e procuradas em sítios de portal remoto.
    Fornecedor de Seedlist
    Seleccione esta opção quando a ferramenta de sequências de hiperligações utilizar uma seedlist como a origem de conteúdo para o conjunto.
    Site do Portal
    Seleccione esta opção quando a origem de conteúdo for o sítio local do portal.
    Nota: Ao criar uma origem de conteúdo do sítio do portal num ambiente de conjunto de unidades configurado com SSL, é necessário fornecer informações de segurança de células para o servidor da Web e para os nós. Por exemplo, num conjunto de unidades com o URL de conjunto de unidades https://web_server/wps/portal, o URL do nó principal http://node_1:10039/wps/portal e o URL do nó secundário http://node_2:10050/wps/portal, é necessário facultar o ID de utilizador e a palavra-passe do servidor da Web e ambos os nós 1 e 2.
    Sítio do Web Content Manager
    Para disponibilizar uma origem de conteúdo deste tipo para Procura do portal, é necessário criá-la na portlet de autoria do Web Content Manager. Seleccione a opção apropriada para disponibilizá-la para procura e especifique o conjunto de pesquisa ao qual pertence. Quando concluir a criação do sítio Web Content Manager, este será apresentado entre origens de conteúdo para o conjunto de procura especificado. Para obter informações sobre como criar o URL para a origem de conteúdo, consulte Seedlist 1.0 REST service API na documentação do Web Content Manager.

    A selecção efectuada determina alguns dos campos de entrada de dados e opções disponíveis para a criação da origem de conteúdo. Por exemplo, a opção Obeyrobots.text no separador Parâmetros avançados está disponível apenas se seleccionar Sítio da Web como o tipo de origem de conteúdo.

    No caso de algumas origens de conteúdo poderá ser necessário introduzir dados delicados como, por exemplo, um ID do utilizador e uma palavra-passe. Por exemplo, esta ação aplica-se a sítios seguros do WebSphere Portal. Para se certificar de que estes dados confidenciais são codificados quando armazenados, actualize e execute o ficheiro searchsecret.xml utilizando a interface de configuração de XML antes de criar a origem de conteúdo

  3. Defina os parâmetros e configure a origem de conteúdo dos separadores.
    1. Antes de iniciar a sequência de hiperligações, defina o idioma pretendido do ID de utilizador da ferramenta de sequências de hiperligações para que corresponda ao idioma do conjunto de procura no qual é efectuada a procura.
    2. No separador Parâmetros gerais, terá de definir o URL da origem de conteúdo no campo Recolher documentos ligados a partir deste URL:. A ferramenta de sequências de hiperligações precisa deste URL para criar sequências de hiperligações. Para obter informações sobre como criar o URL para a origem de conteúdo, consulte Seedlist 1.0 REST service API na documentação do Web Content Manager.
      Nota: Uma falha da ferramenta de sequências de hiperligações pode ser causada por problemas de redireccionamento do URL. Se ocorrer uma falha, tente editar este campo. Por exemplo, altere o URL para o URL redireccionado.
    3. No separador Parâmetros gerais, pode definir o tempo limite para criar sequências de hiperligação de uma origem de conteúdo de um sítio da Web, utilizando a opção Parar recolha após (minutos). O tempo limite funciona apenas para origens de conteúdo do sítio da Web. Trata-se de um limite de tempo aproximado que poderá ser excedido numa determinada percentagem. A acção de sequência de hiperligações é posta em fila de espera. Assim, poderá demorar alguns minutos até que seja executada e o temporizador se inicie.
    4. No separador Parâmetros avançados, o campo de entrada da codificação predefinida de caracteres inclui o valor inicial predefinido windows-1252, independentemente da definição do Idioma predefinido do portal. Para aceder ao Idioma predefinido do portal, faça clique no ícone do Menu de administração. Em seguida, faça clique em Definições do portal > Definições globais. Introduza a codificação de caracteres predefinida necessária consoante o idioma do portal. Caso contrário, os documentos podem ser apresentados incorrectamente em Pesquisar documentos.
    5. No separador Programadores, defina um agendamento de sequência de hiperligações. A sequência de hiperligações será iniciada assim que possível, conforme o que tiver especificado.
  4. Faça clique em Criar.