Proč uniq počítá stejná slova jako různá?

Zkuste nejprve seřadit:

cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt

Nebo použijte "sort -u", které také eliminuje duplikáty. Viz zde.

Velikost souboru nemá nic společného s tím, co vidíte. Z manuálové stránky uniq(1):

Poznámka:'uniq' nedetekuje opakované řádky, pokud nejsou přilehlé. Možná budete chtít nejprve seřadit vstup nebo použít 'sort -u' bez 'uniq'. Porovnání také respektují pravidla specifikovaná 'LC_COLLATE'.`

Takže spuštění uniq na

a
b
a

vrátí:

a
b
a

URL kódující řetězec ve skriptu bash Zakažte nezarovnané přístupy k paměti na x86/x86_64

Linux