Маленькая утилита для преобразования кодировок в текстовых файлах из Windows-1251 и ANSI в UTF-8 или UTF-8-BOM. Изначально писалась для очень массивных csv файлов, выгруженных из широко известной в узких кругах автоматизированной информационной среды, а уже потом порог совместимости был понижен до All file types.
Аргументы запуска утилиты:
| Параметр | Функция |
|---|---|
| -input filename_in.csv | Путь к исходному файлу. |
| -output filename_out.csv | Путь для сохранения файла с преобразованной кодировкой. |
| -encode <type> | Выбор кодировки для сохранения итогового файла. Принимает значения кодировок: utf-8 и utf-8-bom. |
| -gui | Запуск программы в режиме графического интерфейса. |
Базовый вызов программы выглядит так:
csvutf8.exe -input <файл> -output <файл> -encode <кодировка>
А вот так можно запустить утилиту в режиме графического интерфейса:
csvutf8.exe -gui
Примеры:
# Сохранение файла в кодировке UTF-8 csvutf8.exe -input file.csv -output newfile.csv -encode utf-8 # Сохранение файла в кодировке UTF-8-BOM csvutf8.exe -input file.csv -output newfile.csv -encode utf-8-bom
Вероятно (если/когда найду время) прилеплю хоть какое-то автораспознавание основных кодировок, расширив поддержку исходных файлов.
Репозиторий здесь.
Скачать .Net Framework с этого сайта: 4.5.2 | 4.7.2 | 4.8.1.