GNU/Linux >> Znalost Linux >  >> Linux

Jak odstranit duplicitní slova ze souboru prostého textu pomocí příkazu linux

Za předpokladu, že slova jsou jedno na řádek a soubor je již seřazen:

uniq filename

Pokud soubor není seřazený:

sort filename | uniq

Pokud nejsou jeden na řádek a nevadí vám, že jsou jeden na řádek:

tr -s [:space:] \\n < filename | sort | uniq

To však neodstraní interpunkci, takže možná budete chtít:

tr -s [:space:][:punct:] \\n < filename | sort | uniq

To ale odstraní spojovník ze slov s pomlčkou. "man tr" pro více možností.


ruby -pi.bak -e '$_.split(",").uniq.join(",")' filename ?

Uznávám, že dva druhy citací jsou ošklivé.


Linux
  1. Jak napsat text na obrázek pomocí příkazu Linux

  2. 7 Příklady příkazů Linux Uniq k odstranění duplicitních řádků ze souboru

  3. Jak rozdělit iso nebo soubor pomocí příkazu „split“ v Linuxu

  1. Jak odstranit duplicitní řádky uvnitř textového souboru?

  2. Jak vytvořit řídké soubory v Linuxu pomocí příkazu „dd“.

  3. Jak připojit soubor pomocí příkazu mail v systému Linux?

  1. Jak odstranit (smazat) soubor nebo adresář v Linuxu

  2. Jak vytvořit soubor v Linuxu pomocí terminálu/příkazového řádku

  3. Jak odstraním nové řádky z textového souboru?