Ontologia como recurso de padronização terminológica no processo de recuperação de informação / Ontology as standardization feature terminological in the process of information retrieval

Informação em Pauta

Endereço:
Departamento de Ciências da Informação/UFC. Av. da Universidade, 2762, Benfica.
Fortaleza / CE
60020-181
Site: http://www.periodicos.ufc.br/index.php/informacaoempauta
Telefone: (85) 3366-7300
ISSN: 2525-3468
Editor Chefe: Luiz Tadeu Feitosa
Início Publicação: 31/12/2015
Periodicidade: Semestral
Área de Estudo: Ciência da informação

Ontologia como recurso de padronização terminológica no processo de recuperação de informação / Ontology as standardization feature terminological in the process of information retrieval

Ano: 2016 | Volume: 1 | Número: 1
Autores: Jorge Janaite Neto, Edberto Ferneda
Autor Correspondente: Jorge Janaite Neto | [email protected]

Palavras-chave: Recuperação de informação, Indexação automática, Expansão de consulta, Ontologia, Modelos de recuperação de informação, Information retrieval, Automatic indexing, Query expansion, Ontology, Information retrieval models

Resumos Cadastrados

Resumo Português:

O processo de recuperação de informação envolve um acervo documental que deve ser representado por expressões linguísticas e usuários que tentam descrever linguisticamente as suas necessidades de informação a fim de obterem documentos relevantes para satisfazer tais necessidades. Um sistema de recuperação de informação é, portanto, um ambiente linguístico mediador na comunicação entre um estoque de informação e seus requisitantes. Sua eficiência depende de um controle adequado da linguagem de representação dos itens de informação e das requisições dos usuários. Este trabalho apresenta um método de utilização de ontologias na recuperação de informação. Utiliza-se o Modelo Espaço Vetorial como estrutura formal para a representação dos documentos e das buscas dos usuários. Os vetores dos documentos são criados durante o processo de indexação automática no qual uma ontologia fornece novos termos além daqueles extraídos do texto, enriquecendo, assim a representação do documento. O vetor de busca é criado a partir de um processo de expansão de consulta no qual, a partir de inferências em uma ontologia, novos termos são inseridos na expressão de busca inicialmente formulada pelo usuário. Pretende-se com isso uniformizar as representações dos documentos e das buscas, melhorando assim a precisão do processo de recuperação de informação.



Resumo Inglês:

Information Retrieval process involves a collection of documents that must be represented by linguistic expressions and users trying to describe linguistically their information need in order to obtain relevant documents that meet such needs. Therefore, an information retrieval system is a linguistic environment mediating the communication between a stock of information and its users. Its effectiveness depends on adequate control of language for representation of information items and requests of its users. This paper presents a method of using ontologies in information retrieval process. It uses the Vector Space Model as a formal structure for the representation of documents and queries. The documents vectors are created during the automatic indexing process, in which the ontologies provide new terms in order to enrich those representations. The search vector is created from a query expansion process in which, from inferences in ontology, new terms are entered in the search expression initially formulated by the user. The aim is standardize the representations of documents and searches, thus improving the information retrieval process.