Um problema comum para quem trabalha com sistemas Linux é relacionado ao processamento de arquivos textos gerados por um S.O Windows. A codificação padrão do Windows é iso-8859-1, enquanto a do Linux é UTF-8. Assim, abrir um arquivo com codificação iso-8859-1 não seria interpretado corretamento no Gedit, por exemplo.
Para contornar esse problema, podemos utilizar o comando iconv para fazer a conversão entre formatos. Supondo um arquivo texto chamado “aula.tex”, com codificação iso-8859-1, podemos utilizar o comando abaixo para converter para UTF-8:
iconv -f iso8859-1 -t utf-8 aula.tex -o aula_marvin.tex
Resumidamente, podemos interpretar o -f como from (de) iso8859-1 e o -t como to (para) utf-8. O arquivo de entrada é o aula.tex e o arquivo de saída é aula_marvin.tex, especificado através do parâmetro -o. Foi necessário especificar o arquivo de saída pois, por padrão, o iconv escreve o resultado do processamento no terminal, não modificando, assim, o arquivo original.
Para descobrir o a codificação de um arquivo, podemos utilizar o comando file. Por exemplo:
file -i aula_marvin.txt aula_marvin.txt: text/plain charset=utf-8
0sem comentários ainda