GOOFRE version 2: voir et traiter 600 milliards de mots

Texto Digital

Endereço:
Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Departamento de Língua e Literatura Vernáculas. Campus Universitário UFSC/CCE, 5º andar, sala 515. Trindade. Florianópolis.
Florianópolis / SC
88.040-900
Site: http://www.periodicos.ufsc.br/index.php/textodigital/index
Telefone: (48) 3721-6590
ISSN: 18079288
Editor Chefe: Everton Vinicius de Santa
Início Publicação: 31/05/2004
Periodicidade: Semestral
Área de Estudo: Letras

GOOFRE version 2: voir et traiter 600 milliards de mots

Ano: 2014 | Volume: 10 | Número: 2
Autores: Etienne Brunet, Laurent Vanni
Autor Correspondente: Etienne Brunet | [email protected]

Palavras-chave: google books, culturomics, statistique textuelle, vocabulaire français

Resumos Cadastrados

Resumo Francês:

Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout l’appareillage statistique qu’exige, en réseau ou en local,
l’exploitation des grands corpus.