Teksty jak sieci. Krakowscy badacze na tropie anonimowych autorów

Czytaj dalej
Fot. Anna Kaczmarz
Iwona Krzywda

Teksty jak sieci. Krakowscy badacze na tropie anonimowych autorów

Iwona Krzywda

O tym, jak rozpoznać twórcę, który nie podpisał się pod książką, artykułem czy e-mailem rozmawiamy z Tomaszem Staniszem, doktorantem Zakładu Teorii Systemów Złożonych w Instytucie Fizyki Jądrowej PAN w Krakowie, jednym z twórców nowej metody stylometrii, czyli analizy stylu.

Jeżeli wydrukujemy w „Dzienniku Polskim” tekst bez podpisu autora, jaka jest szansa, że rozpozna Pan, który z dziennikarzy jest jego twórcą?
Całkiem spora. Zakładając oczywiście, że wybór jest ograniczony do kilku osób, stale publikujących na łamach „Dziennika”, których poprzednie teksty mogą posłużyć jako materiał porównawczy, Wynik takiej analizy zależy jednak od wielu czynników. Wpływ na niego ma m.in. liczba potencjalnych kandydatów – łatwiej wytypować z grona dwóch pretendentów niż z grona dwudziestu. Ważna jest także objętość tekstu, im obszerniejszy, tym prościej wychwycić pewne charakterystyczne cechy, a zadanie dodatkowo staje się mniej skomplikowane, jeśli autor ma bardzo charakterystyczny, indywidualny styl np. konsekwentnie używa pewnych sformułowań. W badaniach, jakie prowadziliśmy, poddaliśmy analizie książki, czyli teksty stosunkowo długie. Przeanalizowaliśmy 96 książek różnych autorów. Wybieraliśmy z nich losowo po 24 dzieła i próbowaliśmy rozpoznać twórców. Okazało się, że stosując naszą metodę jesteśmy w stanie zrobić to z około 90 proc. skutecznością.

Którego z autorów było najłatwiej rozpoznać?
Wśród badanych przez nas pisarzy nie było żadnego bardzo wyraźnie odstającego od pozostałych. Świadczy to o tym, że zastosowana przez nas metoda jest dość uniwersalna.

Dlaczego fizycy zajęli się badaniem stylu Orwella czy Reymonta?
Formalizm matematyczny, jakiego używa się do statystycznej analizy tekstu w dużej mierze wywodzi się z fizyki. Z fizyki i matematyki wywodzi się również teoria tzw. sieci złożonych. To koncepcja wykorzystywana w różnych dziedzinach nauki – w badaniach z zakresu socjologii, biologii, transportu czy ekonomii. Znając dobrze jej metodologię, postanowiliśmy przetestować zastosowanie sieci w lingwistyce i stylometrii.

Dowiedz się więcej o nowatorskiej metodzie. 

Artykuł dostępny wyłącznie dla prenumeratorów

  • dostęp do wszystkich treści Dziennika Polskiego,
  • codzienne wydanie Dziennika Polskiego,
  • artykuły, reportaże, wywiady i multimedia,
  • co tydzień nowy numer Ekstra Magazynu.
Kup dostęp
Masz już konto? Zaloguj się
Iwona Krzywda

Polska Press Sp. z o.o. informuje, że wszystkie treści ukazujące się w serwisie podlegają ochronie. Dowiedz się więcej.

Jesteś zainteresowany kupnem treści? Dowiedz się więcej.

© 2000 - 2024 Polska Press Sp. z o.o.