[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
=?KOI8-R?Q?=F0=D2=CF=C2=CC=C5=CD=C1_=D3_=D2=D5=D3=D3=C9=C6=C9=CB=C1?==?KOI8-R?Q?=C3=C9=C5=CA_DocBook_=28=D4=D5_=C2=C9_=CB=CF=CE=D4=C9?==?KOI8-R?Q?=CE=D5=C5=C4=2E=2E=2E=29?=
- To: ru-sgml@svib.ru
- Subject: =?KOI8-R?Q?=F0=D2=CF=C2=CC=C5=CD=C1_=D3_=D2=D5=D3=D3=C9=C6=C9=CB=C1?==?KOI8-R?Q?=C3=C9=C5=CA_DocBook_=28=D4=D5_=C2=C9_=CB=CF=CE=D4=C9?==?KOI8-R?Q?=CE=D5=C5=C4=2E=2E=2E=29?=
- From: Ilia Kouznetsov WHATEVER HAPPENS KEEP THE FAITH <ilia@syntext.com>
- Date: Fri, 22 Jan 1999 19:50:04 +0300 (MSK)
- Delivery-Date: Fri, 22 Jan 1999 23:18:33 +0300
- Reply-To: ru-sgml@svib.ru
- Sender: owner-ru-sgml@svib.ru
Джентльмены,
как вы знаете я боролся с проблемой руссификации скрипта Вэлша для DocBook
(я говорю о версии 1.18). С точки зрения скрипта - руссификация
замечательно работает. В частности, можно получать нормальный выход для
теха и HTML для KOI под UNIX.
Но с выходом в форточках остаются проблемы, в которых я завяз и описываю
ниже промежуточный результат. Сил пойти дальше у меня пока не было. Может
кто примет эстафету?
Итак те, кто пробовал получать руссифицированный выход под форточками в
CP1251 знают, что в RTF слова, генерируемые руссифицированным скриптом,
такие как "Глава" и тд НЕ ПОЯВЛЯЮТСЯ ВООБЩЕ. При этом русские ENTITY я не
переопределял в NUMERIC, а оставлял в виде SDATA.
Кроме того я проделал следующий эксперимент. Написал SGML-документ с
помощью русских ENTITY, не используя непосредственно русских букв.
Запустил jade - и получил нормальный выход в RTF содержимого документа,
прописанного ENTITY. НО русские буквы, прописанные энтитями В DSSSL
СКРИПТЕ НЕ ПОЯВЛЯЛИСЬ.
Мораль - jade обрабатывает русские ENTITY из скриптов по-иному, чем
русские ENTITY из самих документов, не вставляя первых в RTF, но правильно
обрабатывая вторые. Инструкции SDATA для русских энтитей из документа он
интерпретирует все и правильно.
При этом эксперименте я не использовал фокусов c -b.
ЗАМЕЧАНИЕ: Когда я запускал jade для немецкой локализации я получал
нормальные умляуты и прочее в строках, генерируемых скриптом. То есть
что-то не в порядке именно с обработкой русских энтитей для CP1251?
ОДНАКО, если получать выход под форточками для KOI8
и соответственно переопределить все русские ENTITY на KOI8 NUMERICS (см
письма Таранова), то в KOI8-шрифтах документ получается. К сожалению,
использование KOI-8 шрифтов в ворде неудобно...
Еще одно принципиальное замечание. В какой-то версии скрипта (точно могу
сказать, что позже версии 1.07) Вэлш поменял принцип активизации
локализаций. Если вы вернетесь к версии 1.07 под форточками, то увидите,
что слова русской локализации в скрипте можно было прописывать прямо
буквами в CP1251, и jade не ругался на "NON-SGML symbol". И конечно
русские слова, генерируемые скриптом появлялись как миленькие.
Сейчас же (1.18) невозможно прописывать русские буквы в скрипте - jade
ругается на NON-SGML символы. Мораль - создавать русифицированные
документы с помощью скрипта Вэлша ver. no. > 1.18 для RTF с не-KOI8
фонтами совершенно невозможно... Я лично продолжаю пользовать версию 1.07.
Как жить дальше?
Может в исходники jade надо прописать таблицу CP1251?
Илия
-------------------------------------------------------------------
-> Ilia V. Kouznetsov: ilia@syntext.com, kuznetjr@sunhe.jinr.ru
-> http://ethereal.ru/~ilia/