Usando a pesquisa de texto completo com arquivos PDF no SQL Server 2005
Estou com um problema estranho na indexação de arquivos PDF no SQL Server 2005 e espero que alguém possa ajudar. Meu banco de dados possui uma tabela chamada MediaFile com os seguintes campos - MediaFileId int identity pk, FileContent image e FileExtension varchar (5). Meu aplicativo da Web armazena o conteúdo do arquivo nesta tabela sem problemas e posso usar a pesquisa de texto completo em documentos, xls, etc. sem problemas - a única extensão de arquivo que não funciona é o PDF. Ao executar pesquisas de texto completo nesta tabela por palavras que eu sei que existem dentro dos arquivos PDF salvos na tabela, esses arquivos não são retornados nos resultados da pesquisa.
O sistema operacional é o Windows Server 2003 SP2 e eu instaleiAdobe iFilter 6.0. Seguindo as instruções emesta entrada do blog, Executei os seguintes comandos:
exec sp_fulltext_service 'load_os_resources', 1;
exec sp_fulltext_service 'verify_signature', 0;
Depois disso, reiniciei o SQL Server e verifiquei se o iFilter para as extensões PDF está instalado corretamente, executando o seguinte comando:
select document_type, path from sys.fulltext_document_types where document_type = '.pdf'
Isso retorna as seguintes informações, que parecem corretas:
document_type: .pdf
caminho: C: \ Arquivos de Programas \ Adobe \ PDF IFilter 6.0 \ PDFFILT.dll
Então, (re) criei o índice na tabela MediaFile, selecionando FileContent como a coluna a ser indexada e FileExtension como seu tipo. O assistente cria o índice e é concluído com êxito. Para testar, estou realizando uma pesquisa como esta:
SELECT MediaFileId, FileExtension FROM MediaFile WHERE CONTAINS(*, '"house"');
Isso retorna arquivos DOC que contêm esse termo, mas não arquivos PDF, embora eu saiba que definitivamente existem arquivos PDF na tabela que contêm a palavracasa.
Aliás, consegui trabalhar com isso por alguns minutos, onde a pesquisa acima retornou os arquivos PDF corretos, mas parou de funcionar novamente sem motivo aparente.
Alguma idéia sobre o que poderia estar impedindo o SQL Server 2005 de indexar PDFs, mesmo que o Adobe iFilter esteja instalado e pareça estar carregado?