|
|
|
![]() Дешифровка — анализ документа, написанного на неизвестном языке и/или неизвестной системой письма. Чаще всего термин используется по отношению к прочтению древних документов. Иногда термины "расшифровка" и "дешифровка" различают. В первом случае речь идёт о прочтении зашифрованного сообщения путём применения предусмотренного алгоритма с использованием известного ключа [т.е., рутинная работа]. Второй термин относится к "взлому" шифра - попытке вскрытия сообщения, не обладая ключом [где нужен интеллект]. На самом деле, интеллект здесь обычно помогает, только если он, опять-таки, сможет обнаружить ключ - хотя бы как первую зацепку. К переводу текста, написанного на языке, в котором используется набор неизвестных обозначений (букв, знаков, символов), можно подходить как к обычной задаче дешифровки (криптоанализу). Текст, который необходимо перевести, можно рассматривать как неизвестный текст, уже переведенный на наш язык, а алгоритмом шифрования будут правила грамматики и синтаксиса языка оригинала. Техники, используемые при решении обеих задач — перевод или дешифровка, — имеют много общего. В обоих случаях нужно соблюсти одно и то же условие: отправитель и получатель должны, по крайней мере, говорить на одном языке. Именно поэтому перевод текстов, написанных на вышедших из употребления языках, как, например, египетское иероглифическое письмо или критское линейное письмо B, был невозможен, пока не был найден способ приведения их в соответствие с каким-то известным языком. В обоих случаях это был древнегреческий. |
Разделы страницы об истории и методах расшифровки письменностей:
История нахождения и расшифровки древних письменностей смотрите в разделах по этим письменностям (имеется и страница находок редких надписей, в т.ч., неизвестных науке письмён). Библиографию по истории, проблемам и методам дешифровки - в литературе по грамматологии и палеографии. Также смотрите обзоры о великих дешифровщиках. Сведения об алгоритмах и программах анализа текста находятся на странице вычислительного языкознания. О современных математических методах шифровки и дешифровки сообщений см. страницу о криптографии.
В специальной работе о методах дешифровки П. Аальто классифицирует различные виды дешифровок следующим образом:
Эту классификацию принимает и И. Фридрих. В зависимости от того, с каким видом дешифровки исследователь имеет дело, он использует, согласно Аальто, те или иные приемы дешифровки; эти приемы кратко перечисляет Фридрих, замечая при этом, что «для раскрытия всякой неизвестной письменности и всякого неизвестного языка необходим хотя бы какой-нибудь опорный момент ["ключ"]; из ничего нельзя ничего дешифровать». Что касается «опорных моментов» при дешифровке письменностей, то Фридрих относит к ним, в частности, следующие:
В понятие дешифровки в самом широком смысле обычно включают три разных вида работы над памятниками письменности:
Но очень часто встречаются и пограничные случаи: язык точно неизвестен, но может быть установлена его принадлежность к определенной группе языков [или хотя бы к языковому типу]; или язык известен нам только в его современном облике, но неизвестны те конкретные черты, которые он имел в древности, в то время, когда создавались интересующие нас памятники [например, майянские иероглифические тексты]. Так же и с письменностью - она может быть очень похожа на соседние или хронологически разные, даже более-менее известные, но не факт, что должны читаться именно как они [например, критские].
В большинстве случаев для одновременного декодирования и языковой интерпретации необходима билингва (классический пример - Розеттский камень, имеющий тексты на иероглифическом египетском, демотическом египетском и древнегреческом языке). Билингвой называются два параллельных текста, написанных на разных языках, но имеющих более или менее одинаковое содержание. Можно создавать и искусственное подобие билингвы [интеречный метод, иногда единственный].
В последнее время в научной среде обострился интерес к вопросам дешифровки и появились надежды, что работа дешифровщика сможет вестись строго объективными, математическими методами, что интуитивный метод сможет быть оставлен и отпадет необходимость в билингвах, наличие которых считалось условием успешной дешифровки. Однако, пока еще ни одна древняя письменность не была целиком расшифрована только новейшими математическими способами.
Тем не менее, чисто объективными, статистическими методами можно значительно подготовиться к расшифровке, если в нашем распоряжении имеются достаточно обширные тексты. Например, для фонетической (буквенной) системы письма в простейшем случае довольно сравнить, насколько часто в данном языке встречаются отдельные буквы с тем, насколько часто повторяются отдельные знаки или условные их сочетания в дешифруемой письменности. Разработаны способы, позволяющие объективно отделить знаки, выражающие гласные, от знаков, выражающих согласные, определить словоделение, если текст записан без разбивки на отдельные слова, устранить лишние знаки, намеренно введенные в шифр.
Однако, дешифровщик, как правило, оперирует с неизвестным языком. Статистическими и машинными методами можно выявить структуру такого языка, то есть общий характер его грамматических особенностей, но не значение слов, потому что смысловая сторона языка пока еще не поддается — и, по-видимому, еще долго не будет поддаваться — выражению с помощью формул и математических символов, а без этого компьютеру нельзя дать задание (программу), нельзя производить подсчеты... (И. Дьяконов, с некоторыми изменениями текста)
Расшифровка письменности, скорее всего, будет успешной, если удастся выполнить хотя бы 2 из 3 условий:
Задачи предварительного анализа новых надписей:
Методы расшифровки:
Также имеются различные комбинации этих методов. Тем не менее, даже их комбинация приводит к самым разным и мало убедительным результатам при небольшом объёме текста (см. проблему расшифровки Фестского диска).
Что касается статистического метода, то его вариантом является «метод позиционной статистики», разработанный гениальным дешифровщиком Юрием Валентиновичем Кнорозовым (1922-199) и примененный при дешифровке письма майя. На основе анализа сочетаемости знаков ему удалось выявить грамматику языка майя. Впоследствии этот метод был применен при исследовании протоиндийских надписей Мохенджо-Даро и Хараппы, письма острова Пасхи и ряда других письменностей. [Это не верно - Ю. В. Кнорозов применил метод позиционной статистики Майкла Вентриса.]
Исходные положения этого метода были выявлены дешифровщиками древних систем письма первой половины XX века и достаточно успешно применялись в 40-50 годы Майклом Вентрисом. Но, в основном, это были скорее удачные находки отдельных исследователей при решении частных задач. Такой предстает дешифровка угаритской клинописи Г. Бауэром. Сходный красивый метод лежит в основе дешифровки древнетюркских рун В. Томсеном. Ю. В. Кнорозов сумел обобщить и развить некоторые опробованные подходы до цельной теории и метода дешифровки. Верность его теоретических разработок была потом блестяще доказана на практике.
Суть «метода позиционной статистики» сводится к следующему:
Довольно надежно это можно установить по количеству знаков:
Логико-комбинаторные методы использовал в своей работе уже Гротефенд в начале XIX в., однако начиная со XX в. они получают особенное распространение в связи с тем, что традиционный сравнительный метод оказывается непригоден, когда достоверно неизвестны ни система письма, ни язык. (Одну из древнеперсидских клинописей немец Гротефенд начал расшифровывать с предположения, что чаще всего в изучаемом им тексте будут встречаться слова, обозначающие имя, отчество и род правителя, а также титул.)
Математический анализ, который провела А. Кобер, позволил выявить некоторые особенности грамматики надписей Линейного письма Б, а также предположить наличие общих гласных или согласных [как?] для некоторых слоговых знаков. [Кстати, интересно, помогло ли ему сопоставление с кипрским силлабарием, где ряд знаков по форме и звучанию очень похож на символы ЛП-Б (например, НА, ТО).]
Один из наиболее интересных дешифровочных алгоритмов был разработан российскими лингвистами Борисом Викторовичем Сухотиным и Виталием Викторовичем Шеварошкиным. Его применили при дешифровке письма древнего индоевропейского народа в Малой Азии – карийцев, которые прославились как отважные мореплаватели и пираты Средиземноморья. В основе алгоритма Сухотина – Шеворошкина лежит простая идея о том, что в потоке речи стечения согласных или гласных встречаются реже, чем сочетания согласного и гласного.
Эту идею специалисты распространили на грамматику. Оказалось, что грамматические морфемы (например, окончания слов, предлоги, союзы в русской лексике) и лексические морфемы (корни) распределяются в тексте подобно гласным и согласным:
Это дает возможность исследовать грамматику неизвестного языка.
Структурно-дистрибутивные методы используются как при анализе плана выражения, так и при анализе плана содержания. Анализируя план выражения, исследователь должен выявить определенные классы письменных знаков на основе их распределения в тексте. Так, Вентрис отделил знаки для гласных (Г) от знаков для согласных с последующим гласным (СГ) благодаря тому, что знаки типа Г встречались, как правило, в начале слов (внутри слов гласные входили в состав знаков типа СГ).
Советский исследователь Б. В. Сухотин разработал алгоритмы, на основании которых гласные могут быть отделены от согласных в буквенном тексте на любом языке. Сухотин проверяет свои алгоритмы на электронно-вычислительных машинах, но возможно идентифицировать классы гласных и согласных в буквенном письме и «вручную». Методика эта основана на определенном свойстве человеческой речи: в ней гласные и согласные распределяются весьма равномерно (причем в языках, допускающих значительные скопления согласных, редки скопления гласных, в языках же, допускающих значительные скопления гласных, скопления согласных либо редки, либо невозможны. Естественно, что в группах из трех букв со срединным гласным в языках первого типа слева и справа будут находиться, как правило, согласные, в языках второго типа слева и справа от согласного будут стоять гласные. К тому же существует немало языков, в которых слова вообще строятся в соответствии со строгой структурой СГСГ, СГСГСГ и т.п. (ср. японский, яванский, из древних — пали и др.). Учитывая эти особенности человеческой речи, нетрудно гласные буквы отделить от согласных (при идентификации отдельных классов можно иметь в виду следующее: в системе — не в цепи — гласных всегда меньше, чем согласных.
Основу структурной дистрибутивной методики исследования плана содержания заложил Ипсен в своем анализе надписи на Фестском диске. Суть этой методики состоит в том, что в тексте можно отделить именные и глагольные флексии от основ соответствующих слов. Сделать это нетрудно: флексии встречаются часто, причем с данной группой основ сочетаются флексии данного, определенного типа (что и позволяет противопоставить имена глаголам). Идя дальше, можно выделить аффиксы (они не столь подвижны, как флексии, тем не менее основы с аффиксами от корневых основ отделить можно).
Структурно-дистрибутивная методика — метод позиционной статистики — была разработана Ю. В. Кнорозовым в его работе по дешифровке письма древних майя.
Почти все вышеизложенное касается по преимуществу «фонетических» видов письма — алфавитных и «слоговых»; идеографические письменности ставят перед исследователем задачи особого рода.
Критское линейное письмо Б (микенское) было расшифровано как раз благодаря особенностям структуры древнегреческого языка:
Фонемы, которые могут встречаться как:
Следовательно, m, n, t могут встречаться и в префиксальной и в постфиксальной позиции [как в Фестском диске?]
Ключевые слова для поиска сведений по дешифровке письменностей:
На русском языке: дешифровка неизвестных письмен, расшифровка древних письменностей,
дешифровочные методы, статистический метод Вентриса, позиционная статистика, палеографические методики,
билингвы, лингвистика текста, автоматизация текстового разбора, автоматический анализ структуры текста,
палеокриптография, палеография, криптография, исследование неразгаданных текстов;
На английском языке: decipher hieroglyphic inscription, decipherment pictural sings, decoding ancient texts.
|
|