Версия для печати

Компьютерная лингвистика

Главная > Лингвистика > Прикладная лингвистика > Компьютерная

Компьютерная лингвистика: от автоматической обработки текста до машинного понимания.

Алгоритмы

Алгоритм, алгорифм (от algorithmi, algorismus, первоначально — латинская транслитерация имени математика аль-Хорезми) - способ (программа) решения вычислительных и других задач, точно предписывающий, какие процедуры необходимо выполнить и в какой последовательности, чтобы получить результат, однозначно определяемый исходными данными. Алгоритм — одно из основных понятий математики и кибернетики. В вычислительной технике для описания алгоритма используются языки программирования.

Основные направления компьютерной лингвистики (англ. computational linguistics, также - Nature Language Processing, NL-Processing, NLP), согласно Википедии:

  • Машинный перевод.
  • Автоматическое распознавание символов (англ. OCR).
  • Автоматическое распознавание речи (англ. ASR).
  • Автоматическое извлечение данных (англ. Data Mining) [с их интеллектуальным анализом, т.е., обнаружение знаний в базах данных].
  • Автоматическое реферированиеаннотирование] текстов.
  • Построение систем управления знаниями.
  • Создание электронных словарей, тезаурусов, онтологий [компьютерная лексикография].
  • Корпусная лингвистика, создание и использование электронных корпусов текстов.

А  также много других, например:

  • Компьютерный анализ жанра и характеристик автора текста [более сложный, чем анализ сюжета].
  • Компьютерный анализ блогосферы как источник знаний о языке [как вариант анализа корпуса текстов].
  • Создание семантической паутины Интернета (формирование пространств знаний) и поиск знаний в ней.

Самые алгоритмически сложные направления машинного языкознания требуют использования языков искусственного интеллекта, таких как Пролог, сферой использования которого может быть:

Судя по всему, компьютерная лингвистика становится основной частью технологий искусственного интеллекта.

На этой странице публикуется информация об информационных технологиях в лингвистике - направлениях, подходах, теориях, программах, алгоритмах...:


Подготовка компьютерных лингвистов

Профессия [компьютерного] лингвиста очень востребована (с сайта ВШЭ):

  1. В компаниях-гигантах IT, так или иначе связанных с задачами текстового поиска и анализа, таких как:
    1. Google,
    2. Яндекс,
    3. Mail.ru,
    4. ABBYY,
    5. Samsung,
    6. Лаборатория Касперского и других.
  2. В стартапах, разрабатывающих новые лингвистические технологии – например, для создания роботов, говорящих на естественном языке ... или для автоматического распознавания эмоций в текстах пользователей социальных сетей.
  3. В компаниях и институтах, занимающихся прикладными лингвистическими задачами и их современными решениями: — для разработки электронных словарей и тезаурусов;
    1. для разработки инновационных методик обучению языку;
    2. для разработки компьютерных моделей естественного языка.
  4. В компаниях, не занимающихся лингвистикой, но нуждающихся в профессионале для обработки больших объемов неструктурированных текстовых данных, например:
    1. в рекрутинге;
    2. в биржевой аналитике;
    3. в юридической поддержке;
    4. в маркетинге.

Где готовят компьютерных лингвистов и вообще хороших лингвистов-теоретиков:

  1. Москва, Академия МИД
  2. Москва (с филиалом в Н.Новгороде), Высшая школа экономики, Факультет филологии ВШЭ (магистерская программа "Компьютерная лингвистика")
  3. Москва, МГИМО
  4. Москва, Филфак МГУ им. Ломоносова
  5. Московский лингвистический университет (МГЛУ им. Мориса Тореза)
  6. Москва, МФТИ, Факультет инноваций и высоких технологий, кафедра распознавания изображений и обработки текста (направления "Интеллектуальные системы" и "Методы машинного обучения").
  7. Санкт-Петербург, Инъяз РГПУ им. А. И. Герцена
  8. Санкт-Петербург, СПбГУ, Гуманитарный факультет, кафедра информационных систем в искусстве и гуманитарных науках (программа "Инженерия гуманитарных знаний").
  9. Новосибирский лингвистический университет (НГЛУ им. Добролюбова)
  10. Пятигорский лингвистический институт

Смотрите также списки вузов с их сайтами. Там в разделе междисциплинарных специальностей приводится статья, где, в первую очередь, выделено 3 вуза: МФТИ, гумфак СПбГУ и филфак ВШЭ - поэтому они здесь и выделены. Но это именно для математиков-лингвистов, а не для лингвистов-математиков.

Конференции по компьютерной лингвистике

Порталы по машинной лингвистике и сборники лингвистических программ

Каталоги программ и указатели по вычислительной лингвистике

Электронные словари, тезаурусы и конкордансы

Сборники русских энциклопедий и словарей для машинной обработки

Писательские лексиконы и конкордансы

Английские тезаурусы и словари

Мультиязычный переводчики и словари

Программы обучения разговорным языкам

Сетевые сборники статей по вычислительному языкознанию

Статьи по квантитативной лингвистике (электронные ресурсы)

Библиография научных трудов по автоматической обработке текстов

Статьи об автоматической структуризации и реферированию текстов

Статьи по методам классификации и категоризации текстов

Также читайте авторскую статью о категоризации информационных ресурсов

Другие статьи по анализу текстовых документов


Главная
Прикладная лингвистика: Компьютерная лингвистика | Структурная лингвистика | ИС по матлингвистике | Авторские задачи по лингвистике текста | О рубрикации электронных ресурсов
Применение в лингвистике: Дешифровка письменностей | Сравнение этимобаз |
Привлекаемые разделы информатики: Алгоритмы | Языки программирования | Кибернетика
Привлекаемые дисциплины: Математика | Когнитивистика | Эвристика
На правах рекламы (см. условия):    


© «Сайт Игоря Гаршина», 2002, 2005. Пишите письма (Письмо И.Гаршину).
Страница обновлена 01.08.2017
Я.Метрика: просмотры, визиты и хиты сегодня