Zkuste nejprve seřadit:
cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt
Nebo použijte "sort -u", které také eliminuje duplikáty. Viz zde.
Velikost souboru nemá nic společného s tím, co vidíte. Z manuálové stránky uniq(1):
Poznámka:'uniq' nedetekuje opakované řádky, pokud nejsou přilehlé. Možná budete chtít nejprve seřadit vstup nebo použít 'sort -u' bez 'uniq'. Porovnání také respektují pravidla specifikovaná 'LC_COLLATE'.`
Takže spuštění uniq
na
a
b
a
vrátí:
a
b
a