[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

=?KOI8-R?B?9yDEz8fPzsvVLi4uICgg0NLPIMTPy8LVyy3T1MnM2M7Jy8kp?=

To: ru-sgml@svib.ru
Subject: =?KOI8-R?B?9yDEz8fPzsvVLi4uICgg0NLPIMTPy8LVyy3T1MnM2M7Jy8kp?=
From: Ilia Kuznetsov WHATEVER HAPPENS KEEP THE FAITH <ilia@syntext.com>
Date: Thu, 24 Jun 1999 12:10:11 +0400 (MSD)
Delivery-Date: Thu, 24 Jun 1999 14:35:11 +0400
Reply-To: ru-sgml@svib.ru
Sender: owner-ru-sgml@asteroid.svib.ru

Вот, нарыл свой результат... Сейчас я заниматься этим не буду.

Успехов,
Илия

---------- Forwarded message ----------
Date: Fri, 22 Jan 1999 19:50:04 +0300 (MSK)
From: Ilia Kouznetsov WHATEVER HAPPENS KEEP THE FAITH <ilia@syntext.com>
Reply-To: ru-sgml@svib.ru
To: ru-sgml@svib.ru
Subject: Проблема с руссификацией DocBook (ту би континуед...)

Джентльмены,

как вы знаете я боролся с проблемой руссификации скрипта Вэлша для DocBook
(я говорю о версии 1.18). С точки зрения скрипта - руссификация
замечательно работает. В частности, можно получать нормальный выход для
теха и HTML для KOI под UNIX.

Но с выходом в форточках остаются проблемы, в которых я завяз и описываю
ниже промежуточный результат. Сил пойти дальше у меня пока не было. Может
кто примет эстафету?

Итак те, кто пробовал получать руссифицированный выход под форточками в
CP1251 знают, что в RTF слова, генерируемые руссифицированным скриптом,
такие как "Глава" и тд НЕ ПОЯВЛЯЮТСЯ ВООБЩЕ. При этом русские ENTITY я не
переопределял в NUMERIC, а оставлял в виде SDATA.

Кроме того я проделал следующий эксперимент. Написал SGML-документ с
помощью русских ENTITY, не используя непосредственно русских букв.
Запустил jade - и получил нормальный выход в RTF содержимого документа,
прописанного ENTITY. НО русские буквы, прописанные энтитями В DSSSL
СКРИПТЕ НЕ ПОЯВЛЯЛИСЬ.

Мораль - jade обрабатывает русские ENTITY из скриптов по-иному, чем
русские ENTITY из самих документов, не вставляя первых в RTF, но правильно
обрабатывая вторые. Инструкции SDATA для русских энтитей из документа он
интерпретирует все и правильно.

При этом эксперименте я не использовал фокусов c -b.

ЗАМЕЧАНИЕ: Когда я запускал jade для немецкой локализации я получал
нормальные умляуты и прочее в строках, генерируемых скриптом. То есть
что-то не в порядке именно с обработкой русских энтитей для CP1251?

ОДНАКО, если получать выход под форточками для KOI8
и соответственно переопределить все русские ENTITY на KOI8 NUMERICS (см
письма Таранова), то в KOI8-шрифтах документ получается. К сожалению,
использование KOI-8 шрифтов в ворде неудобно...

Еще одно принципиальное замечание. В какой-то версии скрипта (точно могу
сказать, что позже версии 1.07) Вэлш поменял принцип активизации
локализаций. Если вы вернетесь к версии 1.07 под форточками, то увидите,
что слова русской локализации в скрипте можно было прописывать прямо
буквами в CP1251, и jade не ругался на "NON-SGML symbol". И конечно
русские слова, генерируемые скриптом появлялись как миленькие.

Сейчас же (1.18) невозможно прописывать русские буквы в скрипте - jade
ругается на NON-SGML символы. Мораль - создавать русифицированные
документы с помощью скрипта Вэлша ver. no. > 1.18 для RTF с не-KOI8
фонтами совершенно невозможно... Я лично продолжаю пользовать версию 1.07.

Как жить дальше?

Может в исходники jade надо прописать таблицу CP1251?

Илия

-------------------------------------------------------------------
-> Ilia V. Kouznetsov: ilia@syntext.com, kuznetjr@sunhe.jinr.ru 
->                     http://ethereal.ru/~ilia/

Prev by Date: Re: xml/sgml editor
Next by Date: Re: jade & russian again
Prev by thread: Re: xml/sgml editor
Next by thread: [comp.lang.tcl.announce] ANNOUNCE: Cost 2.2 released
Index(es):
- Date
- Thread