Mám seznam dat, jako
12345
23456
67891
-20000
200
600
20
...
Předpokládejme, že velikost této datové sady (tj. řádků souboru) je N
. Chci náhodně nakreslit m
řádků z tohoto datového souboru. Výstupem by tedy měly být dva soubory, jeden je soubor obsahující tyto m
řádky dat a druhý obsahuje N-m
řádky dat.
Existuje způsob, jak to provést pomocí příkazu Linux?
Přijatá odpověď:
Možná to není nejefektivnější způsob, ale funguje to:
shuf <file> > tmp
head -n $m tmp > out1
tail -n +$(( m + 1 )) tmp > out2
S $m
obsahující počet řádků.