GNU/Linux >> Znalost Linux > >> Linux

Problémy s používáním sort a comm

Podle comm manual, "Než bude možné použít `comm', musí být vstupní soubory setříděny pomocí porovnávací posloupnosti určené národním prostředím `LC_COLLATE'."

A sort manual:"Pokud není uvedeno jinak, všechna porovnání používají posloupnost řazení znaků specifikovanou v národním prostředí `LC_COLLATE'.

Proto, a rychlý test potvrzuje, LC_COLLATE objednávka comm očekávání poskytuje sort výchozí pořadí, řazení slovníku.

sort umí třídit soubory různými způsoby:

-d :Pořadí slovníku – ignoruje vše kromě bílých znaků a alfanumerických znaků.
-g :Obecná čísla – alfa, poté záporná čísla a poté kladná.
-h :Čitelná pro člověka - negativní, alfa, pozitivní. n < nk = nK < nM < nG
-n :Numerický - zápor, alfa, kladný. k ,M ,G , atd. nejsou zvláštní.
-V :Verze - pozitivní, velká, dolní, negativní. 1 < 1.2 < 1.10
-f :Nerozlišují se malá a velká písmena.
-R :Náhodný – náhodně vstup.
-r :Reverse – obvykle se používá s jedním z dghnV

Existují samozřejmě i další možnosti, ale tyto pravděpodobně uvidíte nebo budete potřebovat.

Váš test ukazuje, že výchozí pořadí řazení je pravděpodobně -d , pořadí slovníku.

  d   |   g   |   h   |   n   |   V 
------+-------+-------+-------+-------
  1   |  a    | -1G   | -10   |  1
 -1   |  A    | -1k   | -5    |  1G
  10  |  z    | -10   | -1    |  1g
 -10  |  Z    | -5    | -1g   |  1k
  1.10| -10   | -1    | -1G   |  1.2
  1.2 | -5    | -1g   | -1k   |  1.10
  1g  | -1    |  a    |  a    |  5
  1G  | -1g   |  A    |  A    |  10
 -1g  | -1G   |  z    |  z    |  A
 -1G  | -1k   |  Z    |  Z    |  Z
  1k  |  1    |  1    |  1    |  a
 -1k  |  1g   |  1g   |  1g   |  z
  5   |  1G   |  1.10 |  1G   | -1
 -5   |  1k   |  1.2  |  1k   | -1G
  a   |  1.10 |  5    |  1.10 | -1g
  A   |  1.2  |  10   |  1.2  | -1k
  z   |  5    |  1k   |  5    | -5
  Z   |  10   |  1G   |  10   | -10

Náhodně nakreslete určitý počet řádků z datového souboru Jak připojím terminál k oddělenému procesu?

Linux