Прикладные аспекты квантитативной лингвистики
p align="left">В противоположность по меньшей мере, по крайней мере с несомненностью относится к словам Достоевского. Конкордансы на это словосочетание занимают более двухсот страниц текста.Можно было бы подумать, что в русском языке времен Достоевского распределение между по крайней мере и по меньшей мере было именно таким: частота по крайней мере существенно превосходила частоту по меньшей мере. Однако это не так. Предварительный анализ корпуса текстов Гоголя (около трех мегабайт) показывает, что различие в частотности этих единиц не так велико, как у Достоевского: на 1 употребление по меньшей мере -- 83 употребления по крайней мере. Весьма вероятно, что в сфере публицистики того времени различие в частоте употребления по меньшей мере и по крайней мере было еще меньшим и приближалось к современной норме. Здесь тоже можно видеть коррелят авторского видения мира, авторского стиля. По полученным файлам произведений Э. Плющихина, В. Непомнящего и спорных произведений (для каждого текста в отдельности и потрем группам -- «спорная группа», «группа произведений Плющихина», «группа произведений Непомнящего») были составлены словники с указанием абсолютной и относительной частоты употребления (общее количество словоупотреблений по произведениям и по группам см. в приложении к экспертизе). Для компьютерной обработки использовалась программа DIALEX и база данных ACCESS 7 в среде Windows.Из сферы анализа были исключены слова с предметным значением, частота употребления которых определяется конкретной проблемной областью. Были проанализированы группы квазисинонимов для следующих слоев лексической системы языка: наречия,частицы,вводные слова и выражения,фразеологические выражения (идиомы),глаголы речи,союзы и союзные слова.Рассмотрим последовательно примеры квазисинонимов из каждой группы лексем. Наречия степени. Первая проанализированная группа -- наречия со значением неполноты проявления какого-либо свойства, характеристики -- едва и немного. Эти наречия во многих контекстах близки по значению. Однако стилистические предпочтения авторов проявляются в тенденциях выбора этих слов. Относительная частота едва и немного для спорных произведений и произведений Плющихина практически идентична, однако она существенно отличается от относительной частоты употребления этих единиц у Непомнящего: едва = 0,007 % (спорные), 0,006% (Плющихин), 0,018% (Непомнящий); немного = 0,002% (спорные), 0,002% (Плющихин), 0,031 % (Непомнящий) (см. табл. 1).Таблица 1 |
| Спорные произведения | Произведения Плющихина | Произведения Непомнящего | | | Абсолют. частота | Относит. частота | Абсолют. частота | Относит. частота | Абсолют. частота | Относит. частота | | Едва Немного | 6+716)=13 2+1=3 | 0,007 % 0,002 % | 12+3+12=27 1+2+2=5 | 0,006% 0,002 % | 11+18=29 25+25=50 | 0,018% 0,031 % | | | Вторая группа исследованных наречий степени характеризует степень) ожидания некоторого события. К ним относятся лексемы вдруг, внезапно, неожиданно. Все эти наречия очень близки по значению. Тем самым их частотное распределение может рассматриваться как характеристика j авторского стиля. Анализ показывает, что относительные частоты употре-. бления наречий вдруг, внезапно и неожиданно в произведениях «спорной группы» и произведений Плющихина практически совпадают: вдруг -- 0,052% (спорные), 0,05% (Плющихин); внезапно -- 0,001 % (спорные), 0,000% (Плющихин); неожиданно -- 0,007% (спорные), 0,006% (Плющихин) (см. табл. 2). Относительные частоты соответствующих наречий в группе произведений Непомнящего существенно отличаются от первых двух групп: вдруг -- 0,065 %; внезапно -- 0,005 %; неожиданно -- 0,016 %.Таблица 2 |
| Спорные произведения | Произведения Плющихина | Произведения Непомнящего | | | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | | Вдруг Внезапно Неожиданно | 61+30=91 1+1=2 10+2=12 | 0,052% 0,001 % 0,007 % | 52+16+39=107 0+0+0=0 5+0+7=12 | 0,05% 0,000 % 0,006% | 79+25=104 7+1=8 12+13=25 | 0,065 % 0,005 % 0,016% | | |
Третья группа проанализированных наречий степени -- лексемы очень и слишком. Частотное распределение этих единиц с определенностью указывает на сходство спорной группы произведений с произведениями Плющихина. С другой стороны, относительная частота употребления очень и слишком в текстах Непомнящего существенно выше -- 0,17 % для очень (0,06 % и 0,05 % в спорной группе и в группе текстов Плющихина соответственно), 0,06% для слишком (0,01 % и 0,01 % в спорной группе и в группе текстов Плющихина) -- см. табл. 3. Тенденция к использованию лексем, имеющих в значении идею «превышения нормы какого-то свойства», характерная для Непомнящего, проявляется и в частоте употребления количественного наречия много, ср. 0,06 % в текстах Непомнящего (абс. част. 100), 0,01 % (абс. част. 26) в спорной группе, 0,02% (абс. част. 42) в произведениях Плющихина. Таблица 3 |
| Спорные произведения | Произведения Плющихина | Произведения Непомнящего | | | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | | Очень Слишком | 47+49=96 9+4=13 | 0,06% 0,01% | 32+36+42=110 3+3+8=14 | 0,05% 0,01% | 103+164=267 43+46=89 | 0,17% 0,06% | | | Частицы. Из лексико-грамматического разряда частиц были проанализированы единицы тоже и также, лексема так (в разных значениях). Если по относительной частоте частицы также все группы произведений приблизительно равны, то по относительной частоте частицы тоже первая и вторая группы (спорные произведения и произведения Плющихина) объединяются и противопоставляются третьей -- произведениям Непомнящего. Аналогично по частоте лексемы так противопоставлены спорная группа произведений и произведения Плющихина, с одной стороны, и произведения Непомнящего -- с другой (см. табл.4).Таблица 4 |
| Спорные произведения | Произведения Плющихина | Произведения Непомнящего | | | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | | Тоже | 74+63=137 | 0,08% | 55+36+66=157 | 0,07% | 89+129=218 | 0,14% | | Также | 13+29=42 | 0,02% | 11+5+15=31 | 0,01% | 5+21=26 | 0,02% | | Так | 208+223=431 | 0,25% | 166+239+118=523 | 0,25% | 370+295=665 | 0,42% | | |
Вводные слова и выражения. Как известно, к числу вводных слов относятся лексемы, в которых говорящий выражает свое отношение к сказанному, в частности оценку достоверности-недостоверности пропозиции. Была исследована частота употребления лексических единиц конечно, разумеется, естественно, связанных с выражением уверенности в истинности утверждаемого (см. табл. 5). Легко видеть, что относительные частоты употребления этих выражений в группе спорных произведений и в произведениях Плющихина практически совпадают, причем из группы квазисинонимов конечно, разумеется, естественно предпочтение отдается конечно. В группе произведений Непомнящего относительная частота употребления конечно ниже, чем в первых двух группах, что компенсируется использованием вводных слов разумеется и естественно. Таблица 5 |
| Спорные произведения | Произведения Плющихина | Произведения Непомнящего | | | Абсолют. | Относ. | Абсолют. | Относ. | Абсолют. | Относ. | | | частота | частота | частота | частота | частота | частота | | Конечно | 114+86= 200 | 0,12% | 113+55+100= 268 | 0,13% | 88+77=165 | 0,10% | | Разумеется | 0+0=0 | 0,00% | 0+0+0=0 | 0,00% | 33+13=46 | 0,03% | | Естественно | 2+1=3 | 0,002 % | 0+0+0=0 | 0,00% | 16+3=19 | 0,01% | | |
Фразеологизмы. Специфические особенности использования фразеологизмов относятся к числу наиболее характерных стилевых особенностей. Для анализа была привлечена группа бранных идиом с компонентом черт, хер и хрен типа черт/хер/хрен его знает, черт/хер/хрен их знает и т. д. Было установлено, что эти выражения встречаются только в группе спорных произведений (абс. частота 8) и в текстах Плющихина (абс. частота 17). Показательно использование довольно редкой идиомы тем паче: она не встречается в произведениях Непомнящего, но представлена в текстах спорной группы (5 употреблений) и в произведениях Плющихина (2 употребления). Глаголы речи. Среди глаголов речи наибольший интерес представляют те лексемы, которые используются как авторские ремарки для введения речи персонажей. В имеющемся материале были проанализированы глаголы сказать и возразить. Несмотря на то, что по законам жанра (исследовались детективные романы) конфликтных ситуаций в спорных текстах и в произведениях Плющихина не меньше, чем в произведениях Непомнящего, возразить существенно чаще используется именно в последней группе, что является несомненным признаком авторского стиля -- см. табл. 6. Таблица 6 |
| Спорные произведения | Произведения Плющихина | Произведения Непомнящего | | | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | | Сказать Возразить | 1059 2 | 0,61% 0,00% | 1087 0 | 0,51% 0,00% | 919 46 | 0,57% 0,03% | | | Союзы и союзные слова. Анализировались также союзы и союзные слова поскольку, почему и если. Слово почему, кроме собственно союзного употребления, функционирует как вопросительное слово; для данного типа исследования это несущественно. По распределению частоты употребления и в этом случае группа произведений Плющихина существенно сближается с группой спорных произведений, а группа произведений Непомнящего противопоставлена первым двум группам, ср. для поскольку 0,03 % и 0,03 % vs. 0,00 %; для почему 0,05 % и 0,04 % vs. 0,13 %; для если 0,22 % и 0,23 % vs. 0,31 % (см. табл. 7).Таблица 7 |
| Спорные произведения | Произведения Плющихина | Произведения Непомнящего | | | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | Абсолют. частота | Относ. частота | | Поскольку Почему Если | 48 95 381 | 0,03% 0,05% 0,22% | 57 95 493 | 0,03% 0,04% 0,23% | 6 212 488 | 0,00% 0,13% 0,31% | | | Проведенное исследование позволяет говорить о том, что существуют специфические языковые особенности, отличающие стиль произведений Э. Плющихина от стиля произведений В. Непомнящего. Эти особенности проявляются на различных уровнях лексической системы языка -- в выборе наречий, вводных слов, частиц, фразеологизмов, союзов и союзных слов, а также глаголов речи. Характерные черты стиля Э. Плющихина прослеживаются в произведениях спорной группы «Следователь президента» и «Смоленская площадь». С другой стороны, характерные языковые черты стиля В. Непомнящего не обнаруживаются в произведениях спорной группы. В рамках данного ограниченного по объему материала (для предложенных текстов двух данных писателей) выявленные особенности авторского языка могут рассматриваться как существенный фактор в пользу признания авторства Э. Плющихина на произведения спорной группы.Литература1. Виноградов В. В. Лингвистические основы научной критики текста Вопросы языкознания. 2004. №2, 3.2. Виноградов В. В. Проблема авторства и теория стилей. М., 2005.3. Марусенко М.А. Атрибуция анонимных и псевдонимных текстов методами прикладной лингвистики// Прикладное языкознание. СПб., 2008.4. Пиотровский Р. Г., Бектаев К. Б., Пиотровская А. А. Математическая лингвистика. М. 2007.5. Шайкевич А. Я. Дистрибутивно-статистический анализ в семантике Принципы и методы семантических исследований. М., 2006.6. Шайкевич А. Я. Количественные методы Лингвистический энциклопедический словарь. М., 2008.
Страницы: 1, 2
|
|