Authorship Attribution of Specific Arabic Texts using Character N-gram and Classification Techniques

Loading...
Thumbnail Image

Date

2024-07-14

Journal Title

Journal ISSN

Volume Title

Publisher

University of M'sila

Abstract

EN The written word has always been a cornerstone of civilizations, essential for preserving and transmitting knowledge. Stylometry, at the intersection of linguistics and statistics, aims to identify a text's style, inherent to its author, as well as its era and genre. This technique analyzes anonymous texts to recognize their authors and applies to both ancient and modern texts. This work aims to identify the author of a specific Arabic text and test the robustness of an author recognition system. Features such as character N-Grams and classification techniques are used. FR La parole écrite a toujours été une pierre angulaire des civilisations, essentielle pour préserver et transmettre le savoir. La stylométrie, à l'intersection de la linguistique et des statistiques, vise à identifier le style d'un texte, propre à son auteur, ainsi que son époque et son genre. Cette technique analyse les textes anonymes pour en reconnaître les auteurs et s'applique aux textes anciens et modernes. Ce travail vise à identifier l'auteur d'un texte arabe spécifique et à tester la robustesse d'un système de reconnaissance d'auteur. Les caractéristiques comme les character N-Grams et les techniques de classification sont utilisées.

Description

Keywords

Stylometry, Authorship Attribution, N-Grams Character, Machine Learning.

Citation

Collections