Консольная программ перекодировка cp1251 в utf8 без bom

Linux для человеков!
Обзоры. Фотогалереи. Помощь при использовании сайта. Новое из блога.

Перекодировка текстовых файлов из cp1251 в UTF-8 с помощью iconv. В Windows по умочанию используется кодировка символов CP1251, чем иногда доставляет проблем пользователям других, нормальных ОС, которые давно перешли на юникод и забыли о проблемах с кодировками как страшный сон. Но пользователи Windows как американцы, не знают, что существуют другие страны ОС и сохраняют субтитры в CP1251 что делает их нечитабельными для других. Для решения этой проблемы есть iconv который как раз и служит для перекодировки текстовых файлов из одной кодировки в другую. Во всех почти дистрибутивах данный пакет устанавливается по умолчанию, но если его вдруг не оказалось - установите его с помощью вашего пакетного менеджера.

Для перекодировки достаточно ввести всего одну команду в терминале, а именно: Поясню: ключ "f" задает исходную кодировку в которой файл находится сейчас, ключ "t" указывает целевую кодировку, ключ "o" задает путь для сохранения перекодированного файла. Вот, все очень просто. Так же вы можете таким образом кодировать любые текстовые файлы. Часто и тексты песен попадаются с такой неприятной особенностью.

Недавно узнал более простой и понятный способ перекодировки текстовых файлов - с помощью enconv. Не буду приводить полного синтаксиса и описания всех ключей. Для перекодировки достаточно одного, например: С помощью данной команды мы перегнали текст в UTF-8. Да, именно, просто перегнали без необходимости указания исходной кодировки. Все просто, указываем лишь ту которую хотим получить. Желательно сделать резервнуб копию файла, так как насколько я понял enconv'у нельзя задать выходной файл и изменяться кодировка будет прямо в исходном файле.

Если у кого то есть еще какие то методы перекодировки текстовых файлов - прошу в каменты.

Вам может понравиться: