[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

=?KOI8-R?Q?=F0=D2=CF=C2=CC=C5=CD=C1_=D3_=D2=D5=D3=D3=C9=C6=C9=CB=C1?==?KOI8-R?Q?=C3=C9=C5=CA_DocBook_=28=D4=D5_=C2=C9_=CB=CF=CE=D4=C9?==?KOI8-R?Q?=CE=D5=C5=C4=2E=2E=2E=29?=



Джентльмены,

как вы знаете я боролся с проблемой руссификации скрипта Вэлша для DocBook
(я говорю о версии 1.18). С точки зрения скрипта - руссификация
замечательно работает. В частности, можно получать нормальный выход для
теха и HTML для KOI под UNIX.

Но с выходом в форточках остаются проблемы, в которых я завяз и описываю
ниже промежуточный результат. Сил пойти дальше у меня пока не было. Может
кто примет эстафету?

Итак те, кто пробовал получать руссифицированный выход под форточками в
CP1251 знают, что в RTF слова, генерируемые руссифицированным скриптом,
такие как "Глава" и тд НЕ ПОЯВЛЯЮТСЯ ВООБЩЕ. При этом русские ENTITY я не
переопределял в NUMERIC, а оставлял в виде SDATA.

Кроме того я проделал следующий эксперимент. Написал SGML-документ с
помощью русских ENTITY, не используя непосредственно русских букв.
Запустил jade - и получил нормальный выход в RTF содержимого документа,
прописанного ENTITY. НО русские буквы, прописанные энтитями В DSSSL
СКРИПТЕ НЕ ПОЯВЛЯЛИСЬ.

Мораль - jade обрабатывает русские ENTITY из скриптов по-иному, чем
русские ENTITY из самих документов, не вставляя первых в RTF, но правильно
обрабатывая вторые. Инструкции SDATA для русских энтитей из документа он
интерпретирует все и правильно.

При этом эксперименте я не использовал фокусов c -b.

ЗАМЕЧАНИЕ: Когда я запускал jade для немецкой локализации я получал
нормальные умляуты и прочее в строках, генерируемых скриптом. То есть
что-то не в порядке именно с обработкой русских энтитей для CP1251?

ОДНАКО, если получать выход под форточками для KOI8
и соответственно переопределить все русские ENTITY на KOI8 NUMERICS (см
письма Таранова), то в KOI8-шрифтах документ получается. К сожалению,
использование KOI-8 шрифтов в ворде неудобно...

Еще одно принципиальное замечание. В какой-то версии скрипта (точно могу
сказать, что позже версии 1.07) Вэлш поменял принцип активизации
локализаций. Если вы вернетесь к версии 1.07 под форточками, то увидите,
что слова русской локализации в скрипте можно было прописывать прямо
буквами в CP1251, и jade не ругался на "NON-SGML symbol". И конечно
русские слова, генерируемые скриптом появлялись как миленькие.

Сейчас же (1.18) невозможно прописывать русские буквы в скрипте - jade
ругается на NON-SGML символы. Мораль - создавать русифицированные
документы с помощью скрипта Вэлша ver. no. > 1.18 для RTF с не-KOI8
фонтами совершенно невозможно... Я лично продолжаю пользовать версию 1.07.

Как жить дальше?

Может в исходники jade надо прописать таблицу CP1251?

Илия

-------------------------------------------------------------------
-> Ilia V. Kouznetsov: ilia@syntext.com, kuznetjr@sunhe.jinr.ru 
->                     http://ethereal.ru/~ilia/