|
|
|
Сортировки слов - их виды (морфологическая, статистическая...) и цели.
Разделы страницы о составления словарей различных видов сортировки:
Словарный формат описания приложим не только к области значений слов, но и к другим сторонам функционирования лексической системы. В частотных словарях указывается частота употребления слов в специально сформированной представительной выборке текстов.
Часто́тный слова́рь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован 1) по частоте, 2) по алфавиту (тогда для каждого слова будет указана его частота), 3) по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), 4) по типичности (слова, частотные для большинства текстов), и т. д.
Частотные списки используются для 1) преподавания языка, 2) создания новых словарей, 3) приложений компьютерной лингвистики, 4) исследований в области лингвистической типологии, и т. д.
Частотные словари широко используются в сфере прикладной лингвистики. Данные о частотности употребления необходимы, например, при установлении авторства текста. Важны данные о наиболее частотных словах и при разработке компьютерных программ проверки орфографии.
Обычно частотные словари строятся на основе корпусов текстов: берется набор текстов, представительный для языка в целом, для некоторой предметной области или данного автора (см. Частотный словарь Грибоедова) и из него извлекаются словоформы, леммы и части речи (последние извлекаются в случае, если корпус имеет морфологическую разметку).
Наиболее очевидной задачей частотного словаря яляется его вспомогательная роль при составлении двуязычного словаря различного объёма, в первую очередь, базовых словарей и словарей языковых минимумов (различных "топов" - Top'500, Top'1000 ...). Также частотный словарь может понадобиться для начального этапа составления идеографического словаря, т.к. сначала нужно семантически расклассифицировать базовый словарь языка.
Примером частотного словаря является Словарь Шарова.
Также смотрите литературу о частотных словарях русского языка.
Алфавитная сортировка слов в обратном порядке позволяет выделить окончания и суффиксы родных и заимствованных слов. Это помогает составлению морфологических схем - реляционных (словоизменительных) и деривационных (словообразовательных), что необходимо для создания морфологических словарей.
Примером морфологического является Словарь Тихонова. А вот - пример обращённого словаря Зализняка.
Авторская | Историческая | Пересортированная | Семантических классов | Семантических отношений | Морфемная Толковая
Семантика | Терминология | Этимология | Ономастика | Фразеология | Книги по ономастике | Книги о слове и смысле | Иностранные словари
Ключевые слова для поиска сведений по лексикографии (словарному делу):
На русском языке: лексикография пересортированного словофонда, составление частотных и обратных словарей, статистически отсортированные словники,
обратно упорядоченные списки слов, постфиксальная группировка лексики, реверсивные словарные индексы, минимальные словари базовой лексики;
На английском языке: basic wordlist.
|
|