IBM WebSphere Portal 8.5: Assistência ao utilizador para administradores |
---|
Criar uma origem de conteúdo
Ao criar uma nova origem de conteúdo para um conjunto de procura, essa origem de conteúdo é incluída na sequência de hiperligações e o conjunto de procura é preenchido com documentos dessa origem de conteúdo. Pode determinar a localização em que índice efectua a sequência de hiperligações e quais as informações que obtém.
Procedimento
- Faça clique em Nova origem de conteúdo na página Abrir conjuntos de procura. A portlet Gerir procura apresenta a página Criar uma nova origem de conteúdo.
- A partir do
menu Tipo de origem de conteúdo, pode seleccionar as seguintes
opções:
- Sítio da Web
- Seleccione esta opção para todos os sítios remotos, incluindo sítios da Web e sítios do portal remotos. As páginas anónimas apenas podem ser indexadas e procuradas em sítios de portal remoto.
- Fornecedor de Seedlist
- Seleccione esta opção quando a ferramenta de sequências de hiperligações utilizar uma seedlist como a origem de conteúdo para o conjunto.
- Site do Portal
- Seleccione esta opção quando a origem de conteúdo for o sítio local do portal.Nota: Ao criar uma origem de conteúdo do sítio do portal num ambiente de conjunto de unidades configurado com SSL, é necessário fornecer informações de segurança de células para o servidor da Web e para os nós. Por exemplo, num conjunto de unidades com o URL de conjunto de unidades https://web_server/wps/portal, o URL do nó principal http://node_1:10039/wps/portal e o URL do nó secundário http://node_2:10050/wps/portal, é necessário facultar o ID de utilizador e a palavra-passe do servidor da Web e ambos os nós 1 e 2.
- Sítio do Web Content Manager
- Para disponibilizar uma origem de conteúdo deste tipo para Procura do portal, é necessário criá-la na portlet de autoria do Web Content Manager. Seleccione a opção apropriada para disponibilizá-la para procura e especifique o conjunto de pesquisa ao qual pertence. Quando concluir a criação do sítio Web Content Manager, este será apresentado entre origens de conteúdo para o conjunto de procura especificado. Para obter informações sobre como criar o URL para a origem de conteúdo, consulte Seedlist 1.0 REST service API na documentação do Web Content Manager.
A selecção efectuada determina alguns dos campos de entrada de dados e opções disponíveis para a criação da origem de conteúdo. Por exemplo, a opção Obeyrobots.text no separador Parâmetros avançados está disponível apenas se seleccionar Sítio da Web como o tipo de origem de conteúdo.
No caso de algumas origens de conteúdo poderá ser necessário introduzir dados delicados como, por exemplo, um ID do utilizador e uma palavra-passe. Por exemplo, esta ação aplica-se a sítios seguros do WebSphere Portal. Para se certificar de que estes dados confidenciais são codificados quando armazenados, actualize e execute o ficheiro searchsecret.xml utilizando a interface de configuração de XML antes de criar a origem de conteúdo
- Defina os parâmetros e configure a origem de conteúdo dos separadores.
- Antes de iniciar a sequência de hiperligações, defina o idioma pretendido do ID de utilizador da ferramenta de sequências de hiperligações para que corresponda ao idioma do conjunto de procura no qual é efectuada a procura.
- No separador Parâmetros gerais, terá de
definir o URL da origem de conteúdo no campo Recolher documentos
ligados a partir deste URL:. A ferramenta de sequências de hiperligações
precisa deste URL para criar sequências de hiperligações. Para obter informações
sobre como criar o URL para a origem de conteúdo, consulte Seedlist 1.0 REST service
API na documentação do Web Content Manager. Nota: Uma falha da ferramenta de sequências de hiperligações pode ser causada por problemas de redireccionamento do URL. Se ocorrer uma falha, tente editar este campo. Por exemplo, altere o URL para o URL redireccionado.
- No separador Parâmetros gerais, pode definir o tempo limite para criar sequências de hiperligação de uma origem de conteúdo de um sítio da Web, utilizando a opção Parar recolha após (minutos). O tempo limite funciona apenas para origens de conteúdo do sítio da Web. Trata-se de um limite de tempo aproximado que poderá ser excedido numa determinada percentagem. A acção de sequência de hiperligações é posta em fila de espera. Assim, poderá demorar alguns minutos até que seja executada e o temporizador se inicie.
- No separador Parâmetros avançados, o campo de entrada da codificação predefinida de caracteres inclui o valor inicial predefinido windows-1252, independentemente da definição do Idioma predefinido do portal. Para aceder ao Idioma predefinido do portal, faça clique no ícone do Menu de administração. Em seguida, faça clique em Definições do portal > Definições globais. Introduza a codificação de caracteres predefinida necessária consoante o idioma do portal. Caso contrário, os documentos podem ser apresentados incorrectamente em Pesquisar documentos.
- No separador Programadores, defina um agendamento de sequência de hiperligações. A sequência de hiperligações será iniciada assim que possível, conforme o que tiver especificado.
- Faça clique em Criar.
- Definir os parâmetros gerais para uma origem de conteúdo
Defina os parâmetros gerais para a origem de conteúdo, preenchendo os campos de entrada e efectuando as selecções no separador Parâmetros gerais. - Definir os parâmetros avançados para uma origem de conteúdo
Defina os parâmetros avançados para a origem de conteúdo, preenchendo os campos de entrada e efectuando as seleções no separador Parâmetros avançados. - Configuração
Configure os Programadores, Filtros e a Segurança a partir dos respectivos separadores na página Criar uma nova origem de conteúdo.