2011/6/11 Amir E. Aharoni <amir.aharoni(a)mail.huji.ac.il>
Какие, например, особые меры надо принимать для
перехода в юникод?
В первую очередь надо объявить все самопальные кодировки вне стандарта. Я
заметил, были такие тенденции добавлять начертания национальных символов в
существующие cp1251 или KOI8-R. Но и для 1251 и для КОИ8 есть строго
описанные стандарты (наверно даже ГОСТы), где кждому восьмибитному коду
назначен свой символ с чётко обозначенным начертанием. Так что любые
изменения в этих таблицах - это отклонение от стандарта. И какимм бы новыми
стандартами их не называй, национальными, республиканскими - продвинуть их
(в данном случае снизу вверх) будет весьма и весьма затруднительно. Когда
такие телодвижения попадают под внимание компетентных специалистов, у них
сразу возникает вопрос: "А чем, собственно, вам юникод не подходит?"
Я понимаю, всегда жалко выбрасывать то, на что уже потрачено много сил и
времени. Люди разрабатывали свои кодировки, тщательно вырисовывали буковки
для шрифтов. Когда не был ещё придуман юникод, это возможно было чуть-ли не
единственным выходом. Я сам этим занимался когда-то, и Якутский
госуниверситет вполне пользовался моими поделками. Но времена меняются
всегда. И надо смотреть вперёд и находить в себе силы отказаться от старого
в пользу прогресса. Перечеркнуть тупиковый проект, сколько бы в него не было
вложено, и использовать то, что уже разработано и поддерживается ведущими
производителями. Я так думаю.
Переход на юникод - довольно финансоёмкий процесс. Многие американские
корпорации, особенно те, кто уже давно работает с документами, ещё с
доюникодовых времён, рано или поздно сталкиваются сейчас с проблемой
интернационализации. Глобализация заставляет. И это очень непростой процесс.
Ищутся и выделяются немалые фонды под один только проект перехода на юникод.
Разрабатываются тактические и стратегические планы по переходу, как это
сделать скоро и с минимальным вредом для текущего бизнеса. Должно быть
сконвертировано всё, начиная от самой инфраструктуры, поля и таблицы в базах
данных, и кончая пользовательским интерфейсом, скажем веб-сервер должен
выдавать юникод в юникоде, а не как это часто бывает, юникодовые символы в
закодированном виде для инкапсуляции в текст в другой кодировке (такие
полумеры часто всё равно превращаются в вопросики на каком-нть этапе).
Михаил Кыраһа
http://mikhail.kyraha.com/