Версия для печати

Дешифровка письмён - теория и методы

Главная > Лингвистика > Письменности > Палеокриптография

Словари древних языков: А | Б | В | Г | Д | З | И | К | Л | М | Н | О | П | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Э | Ю | Я
Определение письменности по форме знаков (с Луркморя)

Дешифровка — анализ документа, написанного на неизвестном языке и/или неизвестной системой письма. Чаще всего термин используется по отношению к прочтению древних документов.

Иногда термины "расшифровка" и "дешифровка" различают. В первом случае речь идёт о прочтении зашифрованного сообщения путём применения предусмотренного алгоритма с использованием известного ключа [т.е., рутинная работа]. Второй термин относится к "взлому" шифра - попытке вскрытия сообщения, не обладая ключом [где нужен интеллект]. На самом деле, интеллект здесь обычно помогает, только если он, опять-таки, сможет обнаружить ключ - хотя бы как первую зацепку.

К  переводу текста, написанного на языке, в котором используется набор неизвестных обозначений (букв, знаков, символов), можно подходить как к обычной задаче дешифровки (криптоанализу). Текст, который необходимо перевести, можно рассматривать как неизвестный текст, уже переведенный на наш язык, а алгоритмом шифрования будут правила грамматики и синтаксиса языка оригинала. Техники, используемые при решении обеих задач — перевод или дешифровка, — имеют много общего. В  обоих случаях нужно соблюсти одно и то же условие: отправитель и получатель должны, по крайней мере, говорить на одном языке.

Именно поэтому перевод текстов, написанных на вышедших из употребления языках, как, например, египетское иероглифическое письмо или критское линейное письмо B, был невозможен, пока не был найден способ приведения их в соответствие с каким-то известным языком. В обоих случаях это был древнегреческий.

Разделы страницы об истории и методах расшифровки письменностей:

История нахождения и расшифровки древних письменностей смотрите в разделах по этим письменностям (имеется и страница находок редких надписей, в т.ч., неизвестных науке письмён). Библиографию по истории, проблемам и методам дешифровки - в литературе по грамматологии и палеографии. Также смотрите обзоры о великих дешифровщиках. Сведения об алгоритмах и программах анализа текста находятся на странице вычислительного языкознания. О современных математических методах шифровки и дешифровки сообщений см. страницу о криптографии.


Классификация видов и методов расшифровки

В специальной работе о методах дешифровки П. Аальто классифицирует различные виды дешифровок следующим образом:

  1. дешифровка неизвестного письма, которым записан известный язык;
  2. дешифровка неизвестного языка, записанного известным письмом (этот вид работ предпочтительно называть интерпретацией);
  3. дешифровка неизвестного письма и языка (неизвестный язык записан неизвестным письмом).

Эту классификацию принимает и И. Фридрих. В зависимости от того, с каким видом дешифровки исследователь имеет дело, он использует, согласно Аальто, те или иные приемы дешифровки; эти приемы кратко перечисляет Фридрих, замечая при этом, что «для раскрытия всякой неизвестной письменности и всякого неизвестного языка необходим хотя бы какой-нибудь опорный момент ["ключ"]; из ничего нельзя ничего дешифровать». Что касается «опорных моментов» при дешифровке письменностей, то Фридрих относит к ним, в частности, следующие:

  1. установление направления письма,
  2. выявление словоразделов,
  3. идентификация типа письма (буквенное, слоговое и т.п.),
  4. возможность выявления собственных имен,
  5. наличие билингв, возможность использования искусственных билингв (вроде надписей на топорах типа «топор такого-то»),
  6. наличие идеограмм или детерминативов, уже известных из других письменностей или имеющих характерный рисуночный облик.

Теория и практика дешифровки (обзор)

В понятие дешифровки в самом широком смысле обычно включают три разных вида работы над памятниками письменности:

  1. В первом случае исследователю надо понять и прочесть надпись или документ, записанный на неизвестном языке, но уже известным письмом - например, этрусские тексты.
  2. Во втором случае язык известен (или, во всяком случае, предполагается известным), но неизвестна система письма: либо текст преднамеренно зашифрован, либо древний народ пользовался двумя разными системами письменности, из которых известна только одна [например, древние греки на Кипре пользовались кипрским силлабарием].
  3. в третьем случае неизвестны ни система письма, ни язык. Здесь необходима и расшифровка (декодирование) и языковая интерпретация одновременно. Это задача самая трудная и самая привлекательная для исследователя. Тут необходима помощь всех вспомогательных дисциплин, всех наличных и возможных научных средств.

Но очень часто встречаются и пограничные случаи: язык точно неизвестен, но может быть установлена его принадлежность к определенной группе языков [или хотя бы к языковому типу]; или язык известен нам только в его современном облике, но неизвестны те конкретные черты, которые он имел в древности, в то время, когда создавались интересующие нас памятники [например, майянские иероглифические тексты]. Так же и с письменностью - она может быть очень похожа на соседние или хронологически разные, даже более-менее известные, но не факт, что должны читаться именно как они [например, критские].

В большинстве случаев для одновременного декодирования и языковой интерпретации необходима билингва (классический пример - Розеттский камень, имеющий тексты на иероглифическом египетском, демотическом египетском и древнегреческом языке). Билингвой называются два параллельных текста, написанных на разных языках, но имеющих более или менее одинаковое содержание. Можно создавать и искусственное подобие билингвы [интеречный метод, иногда единственный].

В последнее время в научной среде обострился интерес к вопросам дешифровки и появились надежды, что работа дешифровщика сможет вестись строго объективными, математическими методами, что интуитивный метод сможет быть оставлен и отпадет необходимость в билингвах, наличие которых считалось условием успешной дешифровки. Однако, пока еще ни одна древняя письменность не была целиком расшифрована только новейшими математическими способами.

Тем не менее, чисто объективными, статистическими методами можно значительно подготовиться к расшифровке, если в нашем распоряжении имеются достаточно обширные тексты. Например, для фонетической (буквенной) системы письма в простейшем случае довольно сравнить, насколько часто в данном языке встречаются отдельные буквы с тем, насколько часто повторяются отдельные знаки или условные их сочетания в дешифруемой письменности. Разработаны способы, позволяющие объективно отделить знаки, выражающие гласные, от знаков, выражающих согласные, определить словоделение, если текст записан без разбивки на отдельные слова, устранить лишние знаки, намеренно введенные в шифр.

Однако, дешифровщик, как правило, оперирует с неизвестным языком. Статистическими и машинными методами можно выявить структуру такого языка, то есть общий характер его грамматических особенностей, но не значение слов, потому что смысловая сторона языка пока еще не поддается — и, по-видимому, еще долго не будет поддаваться — выражению с помощью формул и математических символов, а без этого компьютеру нельзя дать задание (программу), нельзя производить подсчеты... (И. Дьяконов, с некоторыми изменениями текста)

Необходимые и достаточные условия дешифровки

Расшифровка письменности, скорее всего, будет успешной, если удастся выполнить хотя бы 2 из 3 условий:

  1. понять, на каком языке написаны тексты, и найти известные родственные языки;
  2. идентифицировать личные имена;
  3. найти билингвальные тексты.

Методики (планы) разбора текстов

Методика предварительной оценки текста

Задачи предварительного анализа новых надписей:

  1. Подлинность находки
  2. Перепись (каталогизация) знаков и сравнение с имеющимися графическими системами
  3. Если нет прямых аналогов - попытаться найти отдаленные генетические связи
  4. Если отдаленное родство не выявлено - оценка произвольности (беспорядочный набор знаков или речь)
  5. Если речь - попытка дешифровки

Методы расшифровки текстов

Методы расшифровки:

  1. Акрофонический метод основывается на угадывании пиктографического значения знака, которое отождествляется с каким-либо словом одного на древних языков, а первый слог (или фонема) слова принимается за фонетическое значение данного знака.
  2. Иконографический метод основывается на поиске внешнего сходства знаков надписи со знаками других известных письменностей.
  3. Статистические методы основываются на учёте общей частоты встречаемости знаков [в азных позициях слова и предложения, друг с другом, в новых текстах и пр.]. Один из вариантов - метод позиционной статистики.
  4. Логико-комбинаторные методы используются, если не известны ни тип письма, ни язык. [Один из вариантов - метод фоно-грамматической сочетаемости.]

Также имеются различные комбинации этих методов. Тем не менее, даже их комбинация приводит к самым разным и мало убедительным результатам при небольшом объёме текста (см. проблему расшифровки Фестского диска).

Метод позиционной статистики

Что касается статистического метода, то его вариантом является «метод позиционной статистики», разработанный гениальным дешифровщиком Юрием Валентиновичем Кнорозовым (1922-199) и примененный при дешифровке письма майя. На основе анализа сочетаемости знаков ему удалось выявить грамматику языка майя. Впоследствии этот метод был применен при исследовании протоиндийских надписей Мохенджо-Даро и Хараппы, письма острова Пасхи и ряда других письменностей. [Это не верно - Ю. В. Кнорозов применил метод позиционной статистики Майкла Вентриса.]

Исходные положения этого метода были выявлены дешифровщиками древних систем письма первой половины XX века и достаточно успешно применялись в 40-50 годы Майклом Вентрисом. Но, в основном, это были скорее удачные находки отдельных исследователей при решении частных задач. Такой предстает дешифровка угаритской клинописи Г. Бауэром. Сходный красивый метод лежит в основе дешифровки древнетюркских рун В. Томсеном. Ю. В. Кнорозов сумел обобщить и развить некоторые опробованные подходы до цельной теории и метода дешифровки. Верность его теоретических разработок была потом блестяще доказана на практике.

Суть «метода позиционной статистики» сводится к следующему:

  1. По количеству знаков в письме и частоте появления новых знаков в новых текстах определяется тип письма (идеографическое, морфемное, силлабическое, алфавитное).
  2. Затем происходит анализ частоты употребления того или иного знака и анализ позиций, в которых этот знак появляется, определяются функции знаков.
  3. Сопоставление с материалами языков, родственных языку текстов позволяет выявить отдельные грамматические, семантические референты, корневые и служебные морфемы.
  4. Затем выявляется условное фонетическое чтение того или иного знака, устанавливается чтение основного состава знаков. Верность условного чтения подтверждается перекрестным чтением знака в разных позициях и текстах.

Определение типа письма по количеству знаков

Довольно надежно это можно установить по количеству знаков:

  1. 20–40 знаков — алфавитное письмо, где знак соответствует фонеме;
  2. 50–100 знаков — силлабическое письмо, где знак соответствует слогу;
  3. 100–600 знаков — смешанный тип: силлабическое или алфавитное письмо с использованием иероглифов (логограмм и идеограмм). В такой системе силлабические или буквенные знаки гораздо более частотны, чем иероглифические;
  4. > 600 — иероглифическое письмо, где знак соответствует слову (логограмма) или более общему понятию (идеограмма).

Логико-комбинаторные методы

Логико-комбинаторные методы использовал в своей работе уже Гротефенд в начале XIX в., однако начиная со XX в. они получают особенное распространение в связи с тем, что традиционный сравнительный метод оказывается непригоден, когда достоверно неизвестны ни система письма, ни язык. (Одну из древнеперсидских клинописей немец Гротефенд начал расшифровывать с предположения, что чаще всего в изучаемом им тексте будут встречаться слова, обозначающие имя, отчество и род правителя, а также титул.)

Математический анализ, который провела А. Кобер, позволил выявить некоторые особенности грамматики надписей Линейного письма Б, а также предположить наличие общих гласных или согласных [как?] для некоторых слоговых знаков. [Кстати, интересно, помогло ли ему сопоставление с кипрским силлабарием, где ряд знаков по форме и звучанию очень похож на символы ЛП-Б (например, НА, ТО).]

Метод фонетической и грамматической сочетаемости

Один из наиболее интересных дешифровочных алгоритмов был разработан российскими лингвистами Борисом Викторовичем Сухотиным и Виталием Викторовичем Шеварошкиным. Его применили при дешифровке письма древнего индоевропейского народа в Малой Азии – карийцев, которые прославились как отважные мореплаватели и пираты Средиземноморья. В основе алгоритма Сухотина – Шеворошкина лежит простая идея о том, что в потоке речи стечения согласных или гласных встречаются реже, чем сочетания согласного и гласного.

Эту идею специалисты распространили на грамматику. Оказалось, что грамматические морфемы (например, окончания слов, предлоги, союзы в русской лексике) и лексические морфемы (корни) распределяются в тексте подобно гласным и согласным:

  1. Грамматических морфем в целом немного, но они встречаются часто и сочетаются с большим числом разных лексических морфем.
  2. Лексических морфем, напротив, много, и каждая из них встречается с небольшим числом грамматических морфем.

Это дает возможность исследовать грамматику неизвестного языка.

Структурно-дистрибутивные методы

Структурно-дистрибутивные методы используются как при анализе плана выражения, так и при анализе плана содержания. Анализируя план выражения, исследователь должен выявить определенные классы письменных знаков на основе их распределения в тексте. Так, Вентрис отделил знаки для гласных (Г) от знаков для согласных с последующим гласным (СГ) благодаря тому, что знаки типа Г встречались, как правило, в начале слов (внутри слов гласные входили в состав знаков типа СГ).

Советский исследователь Б. В. Сухотин разработал алгоритмы, на основании которых гласные могут быть отделены от согласных в буквенном тексте на любом языке. Сухотин проверяет свои алгоритмы на электронно-вычислительных машинах, но возможно идентифицировать классы гласных и согласных в буквенном письме и «вручную». Методика эта основана на определенном свойстве человеческой речи: в ней гласные и согласные распределяются весьма равномерно (причем в языках, допускающих значительные скопления согласных, редки скопления гласных, в языках же, допускающих значительные скопления гласных, скопления согласных либо редки, либо невозможны. Естественно, что в группах из трех букв со срединным гласным в языках первого типа слева и справа будут находиться, как правило, согласные, в языках второго типа слева и справа от согласного будут стоять гласные. К тому же существует немало языков, в которых слова вообще строятся в соответствии со строгой структурой СГСГ, СГСГСГ и т.п. (ср. японский, яванский, из древних — пали и др.). Учитывая эти особенности человеческой речи, нетрудно гласные буквы отделить от согласных (при идентификации отдельных классов можно иметь в виду следующее: в системе — не в цепи — гласных всегда меньше, чем согласных.

Основу структурной дистрибутивной методики исследования плана содержания заложил Ипсен в своем анализе надписи на Фестском диске. Суть этой методики состоит в том, что в тексте можно отделить именные и глагольные флексии от основ соответствующих слов. Сделать это нетрудно: флексии встречаются часто, причем с данной группой основ сочетаются флексии данного, определенного типа (что и позволяет противопоставить имена глаголам). Идя дальше, можно выделить аффиксы (они не столь подвижны, как флексии, тем не менее основы с аффиксами от корневых основ отделить можно).

Структурно-дистрибутивная методика — метод позиционной статистики — была разработана Ю. В. Кнорозовым в его работе по дешифровке письма древних майя.

Почти все вышеизложенное касается по преимуществу «фонетических» видов письма — алфавитных и «слоговых»; идеографические письменности ставят перед исследователем задачи особого рода.

Лингвистические особенности текстов

Особенности индоевропейских текстов

Критское линейное письмо Б (микенское) было расшифровано как раз благодаря особенностям структуры древнегреческого языка:

Особенности семитских текстов

Фонемы, которые могут встречаться как:

  1. Префиксы: ? (алеф), j, m, n, t; (b, h, k, l, w)
  2. Суффиксы: h, k, m, n, t; (w, j)
  3. Однобуквенные слова: l, m; (b, k, w)

Следовательно, m, n, t могут встречаться и в префиксальной и в постфиксальной позиции [как в Фестском диске?]

Статьи о методах шифровки и дешифровки текстов


Главная > Лингвистика > Письменности мира:
Алфавиты | Древнеегипетские | Дальневосточные | Клинописи | Критские | Индейские | Древнекавказские | Эламские | Протоиндские | Океанийские | Миссионерские | Особые | Всемирные
Реестр письменностей | Порталы о письме | Методы дешифровки | Великие дешифровщики | Новые надписи | Недешифрованное письмо | Акустография | Международные символы | Книги по палеографии | Авторские исследования

Языки мира | Страны и города | История народов | Карты
На правах рекламы (см. условия): [an error occurred while processing this directive]    


© «Сайт Игоря Гаршина», 2002, 2005. Автор и владелец - Игорь Константинович Гаршин (см. резюме). Пишите письма (Письмо И.Гаршину).
Страница обновлена 22.03.2024
Яндекс.Метрика