это информационно-справочная система, основанная на собрании русских текстов в электронной форме. Корпус содержит все типы письменных и устных текстов, представленных в русском языке (художественные разных жанров, публицистические, учебные, научные,...
More
это информационно-справочная система, основанная на собрании русских текстов в электронной форме. Корпус содержит все типы письменных и устных текстов, представленных в русском языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т.п.), и все эти тексты входят в корпус пропорционально их доле в языке соответствующего периода времени. Основной корпус сегодня разбит на две группы: середина XX — начало XXI века (современные письменные тексты) и середина XVIII — середина XX века (ранние тексты). Хорошая представительность достигается значительным объемом корпуса (сегодня это 230 млн. словоупотреблений в основном корпусе и 384 млн. словоупотреблений в общем объеме всех корпусов). Корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию). Разметка — главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») текстов. В Национальном корпусе
Less