GNU/Linux >> Znalost Linux >  >> Linux

Problémy s používáním sort a comm

Podle comm manual, "Než bude možné použít `comm', musí být vstupní soubory setříděny pomocí porovnávací posloupnosti určené národním prostředím `LC_COLLATE'."

A sort manual:"Pokud není uvedeno jinak, všechna porovnání používají posloupnost řazení znaků specifikovanou v národním prostředí `LC_COLLATE'.

Proto, a rychlý test potvrzuje, LC_COLLATE objednávka comm očekávání poskytuje sort výchozí pořadí, řazení slovníku.

sort umí třídit soubory různými způsoby:

  • -d :Pořadí slovníku – ignoruje vše kromě bílých znaků a alfanumerických znaků.
  • -g :Obecná čísla – alfa, poté záporná čísla a poté kladná.
  • -h :Čitelná pro člověka - negativní, alfa, pozitivní. n < nk = nK < nM < nG
  • -n :Numerický - zápor, alfa, kladný. k ,M ,G , atd. nejsou zvláštní.
  • -V :Verze - pozitivní, velká, dolní, negativní. 1 < 1.2 < 1.10
  • -f :Nerozlišují se malá a velká písmena.
  • -R :Náhodný – náhodně vstup.
  • -r :Reverse – obvykle se používá s jedním z dghnV

Existují samozřejmě i další možnosti, ale tyto pravděpodobně uvidíte nebo budete potřebovat.

Váš test ukazuje, že výchozí pořadí řazení je pravděpodobně -d , pořadí slovníku.

  d   |   g   |   h   |   n   |   V 
------+-------+-------+-------+-------
  1   |  a    | -1G   | -10   |  1
 -1   |  A    | -1k   | -5    |  1G
  10  |  z    | -10   | -1    |  1g
 -10  |  Z    | -5    | -1g   |  1k
  1.10| -10   | -1    | -1G   |  1.2
  1.2 | -5    | -1g   | -1k   |  1.10
  1g  | -1    |  a    |  a    |  5
  1G  | -1g   |  A    |  A    |  10
 -1g  | -1G   |  z    |  z    |  A
 -1G  | -1k   |  Z    |  Z    |  Z
  1k  |  1    |  1    |  1    |  a
 -1k  |  1g   |  1g   |  1g   |  z
  5   |  1G   |  1.10 |  1G   | -1
 -5   |  1k   |  1.2  |  1k   | -1G
  a   |  1.10 |  5    |  1.10 | -1g
  A   |  1.2  |  10   |  1.2  | -1k
  z   |  5    |  1k   |  5    | -5
  Z   |  10   |  1G   |  10   | -10

Linux
  1. Třídit a počítat Počet výskytů řádků?

  2. Pomocí „sed“ najít a nahradit?

  3. Základní dělení pomocí proměnné a celého čísla?

  1. Použití nástroje Windows Performance Analyzer k řešení problémů s výkonem

  2. tcpdump – rotace zachycených souborů pomocí -G, -W a -C

  3. Instalace a používání XeTeXu

  1. Použití nfsstat a nfsiostat k řešení problémů s výkonem NFS v Linuxu

  2. Používáte Uniq na Unicode Text?

  3. Jak třídit soubory podle jejich oprávnění pomocí Ls?