С “точными числовыми данными” получилось ничуть не лучше. Выборка примеров из основного подкорпуса, от 1917 года до 1991-го, содержит десять наименований:
1. С. М. Голицын. Сказания о земле Московской (1968-1988)
2. Александр Вампилов. Прошлым летом в Чулимске (1971)
3. Что вы знаете и чего не знаете о хлебе // «Химия и жизнь», 1966
4. А. Н. Толстой. Петр Первый. Книга третья (1944)
5. О. М. Фрейденберг. Поэтика сюжета и жанра (1935)
6. Б. С. Житков. Виктор Вавич. Книга первая (1926-1931)
7. О. А. Бессарабова. Дневник (1924)
8. К. А. Фляксбергер. Прикладная ботаника и агрономические знания // «Природа», 1923
9. П. Н. Краснов. От Двуглавого Орла к красному знамени (книга 2) (1922)
10. В. А. Вернадский. Дневник (1917)
На первый взгляд, всё выглядит представительно и сбалансированно. Невооружённому статистикой взгляду видна попытка некого разумного замысла. Тексты с упоминанием полбы как бы перекрывают большинство возможных вариантов использования.
Тут и революционный боевик Житкова, почему-то отнесённый к нежанровой прозе, известнейший исторический роман Алексея Толстого, пьеса Вампилова, пара дневников — неизвестной гражданки Бессарабовой и столь же неизвестного В. А. Вернадского. И даже, как вишенка на торт, роман-эпопея Петра Николаевича Краснова, кавалера гитлеровского Железного креста, повешенного по приговору Военной коллегии Верховного суда СССР 16 января 1947 года.
В подборку вошла докторская диссертация по классической филологии, изданная в виде книги, и нечто, что условно можно отнести к ботанике и истории.
Впрочем, никому неизвестный Вернадский В. А. внезапно оказался известнейшим учёным-естествоиспытателем, Владимиром Ивановичем Вернадским (1863—1945). На сайте, с которого был попячен текст, для знакомства с его отчеством следовало перейти на другую страницу.
В действительности же, всё оказалось до изумления плохо. Почти половина текстов за период с 1917 по 1991 год (4 из 10), отобранных в корпус русского языка “большой командой лингвистов”, не имеет ни малейшего отношения к слову “полба”. Поскольку не может рассматриваться как использование его словоформы:
• [Шаманов (муж, юрист)] Но вот он овладел руками. Ладонью провел полбу и по глазам.) Подними пистолет. [Александр Вампилов. Прошлым летом в Чулимске, 1971]
• И послать мне доложить, что Эс-Эсов, — у нас вы Эс-Эсов, — и если проболтаете кличку, попадет от них и лоб… а от нас полбу! [Б. С. Житков. Виктор Вавич. Книга первая, 1926—1931]
• И что-то все таки (тихонько А[лександр] В[икторович] постучал пальцем полбу) есть… это». [О. А. Бессарабова. Дневник, 1924]
• Выходит Крымов, бледный, полбу пот крупными каплями, черные волосы всклокочены, налипли, как из бани точно. [П. Н. Краснов. От Двуглавого Орла к красному знамени (книга 2), 1922]
Приведённые примеры принципиально не в состоянии выглядеть примерами из русского языка. К этому языку данная подборка если и относится, то исключительно по разделу грубых орфографических ошибок или, что более вероятно, ошибок оцифровки. В сущности, всю эту “полбу” следует писать раздельно — “по лбу”. Примерно так, как это сделано в известнейшей сказке Пушкина. При этом, саму пушкинскую полбу придётся разыскивать отдельно, в неком “поэтическом подкорпусе”. Если догадаешься, где искать. В основной подкорпус национального корпуса русского языка, Александр Сергеевич, несмотря на его несомненное влияние в этом вопросе на современный русский язык, не попал.
Вообще-то, вроде бы принято проверять сведения, позаимствованные из неверифицированных вторичных источников. Всё-таки, в сети можно отыскать не только разные по качеству результаты оцифровки, но и отсканированные страницы изданий всех упомянутых произведений. Похоже, что об этом нехитром научном правиле, труженики полунаучной организации НКРЯ[51] представления не имеют. Во всех случаях, занявшая минимум времени проверка, показала правильность исходного предположения об ошибках.
Как же так? Неужели разработчикам Национального корпуса русского языка[52] знание самого русского языка уже не требуется? Ведь с пониманием написанного у них явные проблемы. Слово “полба” прочитать могут, а вот понять, что оно означает — уже нет. Поскольку за пределами советского периода, с полбой оказались связаны куда более очевидные несуразности, чем слипшиеся слова:
• Левые щеки и полба у каждого были озарены розовым солнцем. [Андрей Вознесенский. На виртуальном ветру, 1998]
• В наших мечтах, в игре нашей фантазии мы легко создаем крошечных лилипутов или гигантов семи пядей полбу, но по законам действительности подобные существа невозможны. [Н. Н. Страхов. Мир как целое, 1872]
У Вознесенского в слове “поллба” потерялась “лишняя” буква и фраза сразу приобрела ярко выраженный эротический характер. А в работе Страхова даже предлог оказался иным — в оригинале “во лбу” (рис. 32).
При таком количестве ошибок, рассматривать статистические результаты или “точные числовые данные о том, как часто встречается определенное слово” — все эти проценты вхождений и прочие IPM — просто бессмысленно.
Рис. 32. Найди “полбу”. Страхов, Мир как целое, 1872. Фрагмент страницы[53].
Впрочем, не удалось бы количественно оценить использование слова “полба” в русском языке за указанный период, даже при полном отсутствии ошибок. К примеру, за филологию в корпусе отвечает целая докторская диссертация Ольги Михайловны Фрейденберг (восемь упоминаний полбы), а за всю биологию вместе с сельским хозяйством — статья Фляксбергера в научно-популярном журнале (одно упоминание). В результате, главным источником упоминания полбы в стране оказалась таки совсем не биология. Такая вот, не слишком пропорциональная доля в языке соответствующего периода. Для сравнения: в монографии Фляксбергера о пшенице, издания того же года, что и диссертация Фрейденберг, полба упоминается двести шестьдесят два раза. Как говорится, почувствуйте разницу!
Порадовало, что Алексей Николаевич Толстой использовал полбу в своём творчестве. Однако саму подборку текстов корпуса в жанре исторической прозы вряд ли можно назвать хоть сколько-нибудь представительной. К примеру, советская художественная литература о Средневековой Руси в Национальном корпусе отсутствует практически полностью[54]. В отличии от огромнейшего количества в нём мусорных, газетно-журнальных публикаций[55]. Не слишком представительно выглядит и то, что больше трети немалого объёма всего Национального корпуса составляет так называемый газетный подкорпус. При таком однобоком подходе, возможность “максимально полно отразить всё разнообразие русского языка” выглядит более чем сомнительно.
Очень забавны типично гуманитарные категории разметки в карточках изданий: “Размер аудитории большая”, “Размер аудитории очень большая”, “Размер аудитории личная”. Прямо как у африканских бушменов, у которых из числительных только — один и много.
Интересно, чем большая аудитория отличается от очень большой? И почему аудитория должна быть личной у дневника, изданного тиражом 2500 экз. в бумаге и лежащего в сети?
У советских, да и у современных российских печатных изданий, имеется замечательный критерий оценки величины аудитории — приводимый в выходных данных тираж. Если у научно-популярной энциклопедии “Жизнь растений” тираж составил 300 тысяч экземпляров, а у аналогичного переводного античного трактата за авторством Теофраста “Исследование о растениях” — три тысячи, то ответ на вопрос о сопоставимой величине аудитории этих изданий выглядит как-то более предметно.
В целом, непродолжительное знакомство с Сервисом НП НКРЯ оставило негативное впечатление. Этакие типовые российские, суверенные Information Technology. Корпус в значительной части сформирован из собранного поисковыми роботами интернет-мусора. Из-за перекосов в формировании и ошибок, недостоверен для статистических исследований в отношении редких слов. Недружественный интерфейс. Вместо поясняющей информации — рекламные тексты о представительности, сбалансированности и академической поддержке. Редкостное хамство в условиях использования и цитирования (особенно удивило требование “обязательная ссылка” на некую статью о корпусе[56]).
Несчастной полбе в очередной раз не повезло с лингвистикой. Теперь уже с лингвистикой корпусной.
Если же говорить серьёзно, то “вопрос о полбе” отразил существование общей проблемы, связанной со способностью информационной системы противостоять заранее не формализованной ошибке. Проблеме, приобретающей всё большее значение с ростом информатизации. Если же этого не учитывать, то, как принято писать в рекламе всякого-разного: “Результат вас может удивить”.
Надо сказать, что результат иной раз и вправду удивляет несказа́нно.
Не так давно автоматизированный онлайн-перевод с латыни у основных поисковых сервисов выглядел очень неказисто. Как оказалось, за последнюю пару лет переводчик Google очень неплохо подтянул этот раздел. Во всяком случае, перевод на русский язык линнеевского описания спельты, которую филологи всё ещё считают полбой, получился соответствующим действительности:
TRITICUM calycibus truncatis quadrifloris = ПШЕНИЦА с усеченными чашечками, четырехцветковая (Google Translate, 12.07.2025)
И неска́занно удивил результат обращения с тем же запросом к аналогичному сервису Яндекса — партнёру некоммерческого партнёрства НКРЯ:
TRITICUM calycibus truncatis quadrifloris = Квадроплан из джунглей "Пшеничные пинки" (Яндекс Переводчик, 12.07.2025)