Type de publication:

Articles

Source:

Literary and Linguistic Computing, Oxford University Press (OUP), Volume 21, Ticket 3, Oxford, United Kingdom, p.311-326 (2006)

ISBN:

0268-1145

Numéro d'appel:

halshs-00092099

URL:

https://halshs.archives-ouvertes.fr/halshs-00092099

Mots-clés:

attribution d'auteur

Résumé:

How to measure proximities and oppositions in large text corpora? Intertextual distance provides a simple and interesting solution. Its properties make it a good tool for text classification, and especially for tree-analysis which is fully presented and discussed here. In order to measure the quality of this classification, two indices are proposed. The method presented provides an accurate tool for literary studies -as is demonstrated by applying it to two areas of French literature, Racine's tragedies and an authorship attribution experiment.Comment mesurer les proximités et les oppositions dans les grandes collections de textes ? La distance intertextuelle fournit une solution simple et intéressante. Ses propriétés en font un bon outil pour la classification, spécialement pour la classification arborée qui présentée et discutée ici en détail. Deux indices sont proposés pour mesurer la qualité de la classification obtenue. Les études littéraires trouveront dans cette méthode fournie un outil efficace, comme le montre cet article grâce à deux applications tirées de la littérature française : les tragédies de J. Racine et une expérience d'attribution d'auteur.

Notes:

Humanities and Social Sciences/Methods and statisticsHumanities and Social Sciences/LiteratureJournal articles

filet
Tag biblio : 
Equipe de recherche :