24 de octubre de 2007

Indexar Documentos PDF en Moss 2007

Ya cuando trabajábamos con SharePoint 2003, una de las cosas que teníamos siempre que hacer era conseguir que el sistema fuera capaz de abrir los ficheros PDF e indexara los contenidos para que fueran alcanzables por medio de las búsquedas.

Por desgracia en esta nueva versión seguimos teniendo el mismo problema, pues bién dado que
acabo de hacer esta configuración me parece buena idea dejarla aqui.

Primero y antes de nada debemos identificar los servidores que tenemos y que rol desempeñan dentro de la topología de nuestro sistema SharePoint.

Por un lado tenemos el servidor de Indexación ( encargado de leer, almacenar e indexar para un rápido acceso la información contenida en el sistema ) y por otro lado tenemos el/los servidores Frontales o Web que se encargan de mostrar la información del sistema.
Y ¿Por qué esta distinción? por que cada uno tiene una tarea que realizar y por lo tanto una configuración independiente para conseguir el objetivo.
Por otro lado, y por complicar un poco más el tema, también tenemos 2 productos SharePoint con los que nos podemos encontrar Windows SharePoint Services 3.0 y Microsoft Office SharePoint Server 2007.

Vamos a empezar con una configuración para WSS 3.0 en un entorno de 2 servidores, el primero para indexación y el segundo para FrontEnd.

Vamos a ir viendo los pasos para instalar en el servidor de indexación:

Instalamos el IFilter en el servidor. (Web para descargar)

Vamos a agregar el tipo '.pdf' en la lista del servidor. Para ello debemos seguir los siguientes pasos:

Iniciamos la consola del registro ( regedit )
Nos movemos a la siguiente clave del registro: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Applications\ \Gather\ Search\ Extensions\ ExtensionList ( Donde será el identificador de idioma de nuestro servidor)
Agregamos una nueva clave de tipo 'String' con el nombre '38' y el valor 'pdf'
Reiniciamos el servidor web ( iisreset )

Lo siguiente que tenemos que hacer es decirle al servidor que debe realizar una reindexación completa de los contenidos. Para ello debemos seguir los siguientes pasos:

En el servidor de indexación abrimos una consola de MS-DOS y ejecutamos los siguentes comandos:
net stop spsearch: Para detener el servicio de indexación de SharePoint.
net start spsearch: Para iniciar el servicio de indexación.
stsadm -o spsearch -action fullcrawlstop: para detener el crawler de información.
stsadm -o spsearch -action fullcrawlstop: para inicial el sistema de crawling del servidor.

Vamos ahora a hacer lo mismo con Microsoft Office SharePoint Server 2007.
Veran que los pasos son más o menos iguales solo que en este caso vamos a hacer uso de los menús de configuración del propio SharePoint.

Instalamos el IFilter en el servidor. (Web para descargar)
Vamos a agregar el tipo '.pdf' en la lista del servidor. Para ello debemos seguir los siguientes pasos:
Vamos a la Administración Central, y en la configuración de los Servicios Compartidos seleccionamos el servicio compartido que estemos utilizando.
Dentro de la configuración de búsquedas agregamos un nuevo tipo de fichero 'pdf'
Reiniciamos el servidor web ( iisreset )
Lo siguiente que tenemos que hacer es decirle al servidor que debe realizar una reindexación completa de los contenidos. Para ello debemos seguir los siguientes pasos:
En el servidor de indexación abrimos una consola de MS-DOS y ejecutamos los siguentes comandos:
net stop osearch: Para detener el servicio de indexación de SharePoint.
net start osearch: Para iniciar el servicio de indexación.
Dentro de la Administración central, una vez estamos en la web de configuración del servicio compartido vamos a la sección de Configuración de Búsquedas.
Iniciamos un crawl completo del servidor.

No hay comentarios.: