Стилостатистический метод анализа текста
Стилостатисти́ческий ме́тод ана́лиза те́кста — метод анализа текста, в рамках которого инструментарий статистики применяется в области стилистики с целью определения особенностей функционирования языка в речи, закономерностей функционирования языка в разных сферах общения, типах текстов, специфики функциональных стилей речи и воздействующих на них экстралингвистических факторов[1].
История[править]
О перспективности использования математических и статистических методов в лингвистике учёные говорили с середины ХIХ века (например, математик В. Я. Буняковский). В начале ХХ столетия на это указывали такие известные лингвисты, как И. А. Бодуэн де Куртенэ, Е. Д. Поливанов, А. М. Пешковский и другие. В 1960-е годы стилостатистический метод начинает широко применяться в лингвистике, в том числе в функциональной стилистике, так как именно объект её изучения — речь — является «благодатной почвой» для применения этих методов[1].
Основы лингвостатистики и стилостатистики изложены в работе Б. Н. Головина «Язык и статистика» (1971)[2]. Вопросы специфического применения статистических методов при изучении разных аспектов стилей освещены в работах А. Я. Шайкевича[3], С. И. Кауфмана[4], М. Н. Кожиной[5] и других[1].
Несмотря на эффективность применения статистики для решения самых разных проблем стилистики и изучения закономерностей функционирования языка в речи, использование статистических методик после «всплеска» активности в 1960—1970 годы пошло на убыль. Это было связано как с трудностями освоения гуманитариями математических знаний (попытка свести статистику к арифметике), так и недостаточной проработкой вопроса интерпретации статистических показателей, а также самой методологии применения последних с учётом особенностей изучаемого стилистикой объекта[1].
Особенности[править]
Возможность и целесообразность применения статистической методики в стилистике обусловлена свойствами языка и речи. Языку и речи свойственна вероятностность. Лингвист Б. Н. Головин отмечает: «…язык действует и речь образуется в соответствии со статистическими законами»[6]. В 1963 году Н. Д. Андреев и Л. Р. Зиндер определили и ввели в научный обиход понятие речевой вероятности. Систему речевой вероятности они определили как «совокупность относительных количественных характеристик, описывающих численные соотношения между элементами в некотором массиве текстов»; «речевая вероятность определяет статистическую структуру текстов, тогда как язык характеризуется их теоретико-множественной структурой и алгоритмами их порождения и распознавания»[7].
Использование стилостатистического метода обусловлено стремлением подтвердить гипотезы и представления о стилистических категориях и явлениях объективными показателями, учитывая, что в этой отрасли языкознания много дискуссионных вопросов, касающихся систематизации и дифференциации стилевых явлений. Одним из главных оснований применения статистики в стилистике является также объективная присущность речи количественных признаков (повторяемости, частотности единиц). Поскольку стилистика изучает функциональный аспект языка, закономерности его функционирования в различных сферах общения и под воздействием ряда экстралингвистических факторов, применение стилостатистического метода анализа в данной области языкознания предопределено её природой[1].
Стилостатистический метод анализа является двуединым качественно-количественным. В рамках стилостатистического анализа количественный подход связан с качественным (лингвостилистическим аспектом языковых единиц и текста), прежде всего с учётом семантики рассматриваемых явлений, их взаимосвязи с мышлением, целями и задачами общения и других экстралингвистических факторов[1].
В рамках стилостатистического метода анализа текста ведётся прежде всего подсчёт языковых единиц, которые функционируют в речи, характеризуясь разными частотами в разных сферах общения, что подтверждается анализом материала. В зависимости от задач это могут быть самые разные единицы — лексические, морфологические, синтаксические, а также текстовые и др. Вероятностно-статистическая устойчивость в данном случае свидетельствует о закономерности явления и, следовательно, о его причинной обусловленности, детерминированной различными экстралингвистическими факторами[1].
См.также[править]
Примечания[править]
- ↑ 1,0 1,1 1,2 1,3 1,4 1,5 1,6 Стилистический энциклопедический словарь русского языка, 2011, с. 499—506
- ↑ См. Головин Б. Н. Язык и статистика. Москва: Просвещение, 1971. 189 с.
- ↑ См. Шайкевич А. Я. Опыт статистического выделения функциональных стилей // ВЯ. 1968. № 1
- ↑ См. Кауфман С. И. Количественный анализ общеязыковых категорий, определяющих качественные особенности стиля // Вопросы романо-германского языкознания, Коломна, 1961.
- ↑ См. Кожина М. Н. О речевой системности научного стиля сравнительно с некоторыми другими. Пермь, 1972.
- ↑ Головин Б. Н. Язык и статистика. М., 1971.
- ↑ Андреев Н. Д., Зиндер Л. Р. О понятиях речевого акта, речи, речевой вероятности и языка // Вопросы языкознания. 1963. № 3.
Литература[править]
![]() | Одним из источников, использованных при создании данной статьи, является статья из википроекта «Рувики» («ruwiki.ru») под названием «Стилостатистический метод анализа текста», расположенная по адресу:
Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC-BY-SA 4.0 и более поздних версий. Всем участникам Рувики предлагается прочитать материал «Почему Циклопедия?». |
---|