[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
=?KOI8-R?B?9yDEz8fPzsvVLi4uICgg0NLPIMTPy8LVyy3T1MnM2M7Jy8kp?=
Вот, нарыл свой результат... Сейчас я заниматься этим не буду.
Успехов,
Илия
---------- Forwarded message ----------
Date: Fri, 22 Jan 1999 19:50:04 +0300 (MSK)
From: Ilia Kouznetsov WHATEVER HAPPENS KEEP THE FAITH <ilia@syntext.com>
Reply-To: ru-sgml@svib.ru
To: ru-sgml@svib.ru
Subject: Проблема с руссификацией DocBook (ту би континуед...)
Джентльмены,
как вы знаете я боролся с проблемой руссификации скрипта Вэлша для DocBook
(я говорю о версии 1.18). С точки зрения скрипта - руссификация
замечательно работает. В частности, можно получать нормальный выход для
теха и HTML для KOI под UNIX.
Но с выходом в форточках остаются проблемы, в которых я завяз и описываю
ниже промежуточный результат. Сил пойти дальше у меня пока не было. Может
кто примет эстафету?
Итак те, кто пробовал получать руссифицированный выход под форточками в
CP1251 знают, что в RTF слова, генерируемые руссифицированным скриптом,
такие как "Глава" и тд НЕ ПОЯВЛЯЮТСЯ ВООБЩЕ. При этом русские ENTITY я не
переопределял в NUMERIC, а оставлял в виде SDATA.
Кроме того я проделал следующий эксперимент. Написал SGML-документ с
помощью русских ENTITY, не используя непосредственно русских букв.
Запустил jade - и получил нормальный выход в RTF содержимого документа,
прописанного ENTITY. НО русские буквы, прописанные энтитями В DSSSL
СКРИПТЕ НЕ ПОЯВЛЯЛИСЬ.
Мораль - jade обрабатывает русские ENTITY из скриптов по-иному, чем
русские ENTITY из самих документов, не вставляя первых в RTF, но правильно
обрабатывая вторые. Инструкции SDATA для русских энтитей из документа он
интерпретирует все и правильно.
При этом эксперименте я не использовал фокусов c -b.
ЗАМЕЧАНИЕ: Когда я запускал jade для немецкой локализации я получал
нормальные умляуты и прочее в строках, генерируемых скриптом. То есть
что-то не в порядке именно с обработкой русских энтитей для CP1251?
ОДНАКО, если получать выход под форточками для KOI8
и соответственно переопределить все русские ENTITY на KOI8 NUMERICS (см
письма Таранова), то в KOI8-шрифтах документ получается. К сожалению,
использование KOI-8 шрифтов в ворде неудобно...
Еще одно принципиальное замечание. В какой-то версии скрипта (точно могу
сказать, что позже версии 1.07) Вэлш поменял принцип активизации
локализаций. Если вы вернетесь к версии 1.07 под форточками, то увидите,
что слова русской локализации в скрипте можно было прописывать прямо
буквами в CP1251, и jade не ругался на "NON-SGML symbol". И конечно
русские слова, генерируемые скриптом появлялись как миленькие.
Сейчас же (1.18) невозможно прописывать русские буквы в скрипте - jade
ругается на NON-SGML символы. Мораль - создавать русифицированные
документы с помощью скрипта Вэлша ver. no. > 1.18 для RTF с не-KOI8
фонтами совершенно невозможно... Я лично продолжаю пользовать версию 1.07.
Как жить дальше?
Может в исходники jade надо прописать таблицу CP1251?
Илия
-------------------------------------------------------------------
-> Ilia V. Kouznetsov: ilia@syntext.com, kuznetjr@sunhe.jinr.ru
-> http://ethereal.ru/~ilia/