Ученые определили время «совершеннолетия» английского языка

Лингвисты проследили за эволюцией самых зачастую употребляемых фраз в книгах на английском языке и установили, непосредственно на рубеже между восемнадцатым и девятнадцатым столетием список данных фраз стабилизировался, и печатный язык, согласно заявлению научных сотрудников, «достиг совершеннолетия». Исследование опубликовано в журнале Journal of the Royal Society Interface.

Работа базируется на корпусе слов, полученном компанией Google в ходе оцифровки книг. Он охватывает около 5 млн. произведений, написанных начиная с 1520 года по настоящее время.

Ученые подвергали анализу, как список самых зачастую встречающихся в текстах фраз меняется от года к году. Как оказалось, непосредственно наиболее древние слова сильнее всего отличаются друг от друга. К примеру, 10 самых зачастую встречающихся фраз в книгах, изданных в 1600 году, могла совершенно не быть похожим с такой так как десяткой из книг 1610 года.

Однако, на рубеже восемнадцатого и девятнадцатого столетий в употреблении фраз произошла достаточно непредвиденная стабилизация. Ученые объясняют скорее всего процессами самоорганизации, которые выражаются в возрастании предпочтительного связывания лексем друг с ином. Условно говоря, слова, которые зачастую употребляются вместе, с годами образуют устойчивое хитросплетение слов Непосредственно вполне вероятно наблюдать и для других явлений — рreferential attachment).

Более зачастую употребляемыми фразами в английском языке за прошедшие БОЛЕЕ ПОЛОВИНЫ ИЗ НИХ лет стали данные сочетания слов как «the end of the» (в конце), «at the same time» (в то так как время; вместе с тем), и «the United States of America» (Соединенные Штаты Америки).

Ранее другая группа научных сотрудников при поддержки того так как намерения Google увидела словарное сокрашение языков. Авторы работали с словами не только лишь на английском, хоть и на испанском языке и иврите. Они установили, непосредственно огромное количество появляющихся последние несколько лет новых слов не способно компенсировать исчезающие лексемы и в общем все 3 исследованных языка становятся беднее.

Комментарии закрыты.


Яндекс цитирования