Previous Entry Редактировать запись Редактировать метки В избранное Поделиться Отслеживать Next Entry
открытие
unix
[info]tobotras
На старости лет осознал, что iconv можно не давать -t. Осталось понять, где он берет кодировку по умолчанию (нет, это не LANG).

А так. env LANG=C iconv -f ... -- все равно даёт мне строчку в КОИ-8.

Это у тебя небось какой-нибудь LC_CTYPE где-нибудь выставлено.
У меня в Linux
echo бНОПНЯ |LANG=C iconv -f CP1251
iconv: illegal input sequence at position 0

А portable iconv (под Solaris 8)
echo бНОПНЯ |LANG=C iconv -f cp1251
iconv: conversion to char unsupported
iconv: try 'iconv -l' to get the list of supported encodings


Тьфу на меня. Я сказал

env LANG=C {источник данных} | iconv

:-)

> (нет, это не LANG).

[info]poige

2008-12-02 14:11 (местное) Удалить Spam Скрыть Заморозить Track This

Да, это LC_CTYPE (или LC_ALL). ;-)

Re: > (нет, это не LANG).

[info]tobotras

2008-12-02 14:15 (местное) Edit Удалить Скрыть Заморозить Track This

Я ещё тупее, чем ты думаешь, см. выше :)

> Я ещё тупее, чем ты думаешь, см. выше :)

[info]poige

2008-12-02 14:20 (местное) Удалить Spam Скрыть Заморозить Track This

Да с кем не бывает…

Кодировку можно определить вполне надежно по статистике триграм, если текста б.м. достаточное количество. Но не думаю, что iconv это умеет :)

iconv не умеет даже заменять отсутствующие в выходной кодировке символы на что-то более-менее осмысленное. Хоть на вопросительный знак.

Выходную кодировку определить нельзя :-D


Групповое действие над комментариями:
Картинка пользователя

Вы читаете свой журнал