Ю. Н. Орлов Определение жанра и автора литературного произведения статистическими методами

Определение жанра и автора литературного произведения статистическими методами
  • Автор: Ю. Н. Орлов
  • Количество страниц: 259
  • Дизайн: Чудинкин Левон
  • В формате: txt, pdf, fb2, epub
  • Прикладная информатика. Научные статьи
  • Научный редактор - Коробок Павел
  • Год печати - 2010

Подробная информация: "Определение жанра и автора литературного произведения статистическими методами"

В работе решается задача кластеризации литературных текстов по авторам и жанрам статистическими методами. Основным инструментом анализа являются функции распределения текста по буквам и буквосочетаниям, а также выборочные буквенные распределения, построенные по фрагментам текстов. Для набора текстов, объём наименьшего из которых достаточен для того, чтобы считать буквенное распределение каждого из них стационарным с ошибкой не более 3%, вычисляются расстояния между распределениями букв в пространстве суммируемых функций. Критерий кластеризации, основанный на близости между двухбуквенными распределениями текстов, позволяет правильно идентифицировать автора с ошибкой не более 5%, а жанр – с ошибкой не более 15%. Однобуквенные распределения дают ошибку 15% и 25% соответственно. Оставляйте и читайте отзывы о книге Ю. Н. Орлов - Определение жанра и автора литературного произведения статистическими методами.


Рекомендуем также: