Mám dilema, zda upravit soubor javascript nebo ne. Když to otevřu pomocí gedit, zobrazí se následující varování:
Soubor, který jste otevřeli, obsahuje neplatné znaky. Pokud budete pokračovat
v úpravách tohoto souboru, můžete tento dokument poškodit. Můžete také zvolit
jiné kódování znaků a zkusit to znovu.
Aktuální kódování je UTF-8. Protože soubor má více než 100 000 řádků kódu, existuje rychlý způsob, jak vyhledat neplatné znaky?
Přijatá odpověď:
Protože je soubor UTF-8, můžete spustit isutf8. Další balíček utils.
Poskytuje vám řádky, znaky a offset pro špatné bajty.
K analýze pak použijte xxd, hexdump nebo podobně.
Bohužel se zastaví při prvním nárazu. Ale zase záleží na souboru. Může
je tam jen jeden špatný bajt 😉
Mějte nějaký kód C, který provádí podobnou analýzu, ale pro celý soubor. Je na
disku někde dávno zapomenutém. V případě potřeby bych to mohl zkusit najít.
Jinak ano, rychle a ne tak špinavým způsobem by bylo udělat rozdíl mezi
kopií uloženou pomocí gedit – jak navrhl dobrý pan. @vonbrand.