Я сохраняю рукопись, написанную моим отцом. Файлы данных находятся на 5,25 "дискете. Я успешно прочитал файлы с дисков, но никто из нас не знает, в каком формате находится язык разметки. Он использовался издателями книг еще в начале 1990-х годов.
Вот несколько строк из одного из файлов.
\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\
Кто-нибудь может определить язык разметки, используемый здесь?
У меня есть и эти оригинальные файлы, и опубликованная книга. Мне было бы не очень сложно понять, что означают коды. Но если формат может быть идентифицирован, может быть доступен какой-то автоматический переводчик в нечто более новое (RTF, XML и т. Д.).
редактировать
Это как загадка, которую нужно разгадать! Вот как начинается стол:
<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>
Я немного погуглил по таким терминам, как begtab
и setbgut
. Последний обнаружил документ в формате PDF, в котором, похоже, есть «опечатка», но опечатка - это setbgut
тег, почти такой же, как и в моих файлах.
http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (поиск setbgut
)
Казалось бы, эта исследовательская работа была разработана с использованием того же программного обеспечения. Я перенес его в Acrobat, и в свойствах говорится, что он был сгенерирован Xyvision Parlance Publisher (XPP). Вот лучшее, что я нашел о них до сих пор: http://www.isgmlug.org/n2-1/n2-1-49.htm
Редактировать 2
Хорошо, теперь я вижу. XPP - это язык разметки, похожий на SGML. Фактически, в литературе по продажам XPP рекламируется, как «легко» взять существующий документ SGML и добавить свои собственные теги. К сожалению, XPP был продан General Dynamics несколько лет назад. Автоматически перевести документ, скажем, в HTML, сложно без DTD. Однако, как отмечали другие, большинство тегов легко понять. Некоторые из них, такие как библиографические ссылки и значения после точки с запятой в тегах, такие как <rrh;1>
и <lp;&-1q>
до сих пор ускользают от меня. Мне придется сравнить файл с физической распечаткой бок о бок, чтобы все это расшифровать.
lrh
и rrh
бегут головы соответственно слева и справа. xlrh
и xrrh
выйдите из режима бегущей головы. cn
центрирует число где-as ct
центрирует заголовок. ital
переводит вас в курсивный режим, а med
переводит обратно в средний режим. %
начинается новый абзац, где обратный слеш просто продолжает абзац. Я не могу понять другие, и сделал несколько поисковых запросов, но ни один не раскрыл формат ...