Existuje pohodlný způsob, jak převést výstup „stromu“ příkazu *nix do formátu JSON?
Upravit:
Myslím, že jsem svůj problém nepopsal dostatečně dobře. Mým cílem je převést něco jako:
.
|-- dir1
| |-- dirA
| | |-- dirAA
| | `-- dirBB
| `-- dirB
`-- dir2
|-- dirA
`-- dirB
do:
{"dir1" : [{"dirA":["dirAA", "dirAB"]}, "dirB"], "dir2": ["dirA", "dirB"]}
Přijatá odpověď:
Pokus 1
Řešení využívající pouze perl, vracející jednoduchý hash struktury hash. Před
OP objasnil datový formát JSON.
#! /usr/bin/perl
use File::Find;
use JSON;
use strict;
use warnings;
my $dirs={};
my $encoder = JSON->new->ascii->pretty;
find({wanted => &process_dir, no_chdir => 1 }, ".");
print $encoder->encode($dirs);
sub process_dir {
return if !-d $File::Find::name;
my $ref=%$dirs;
for(split(///, $File::Find::name)) {
$ref->{$_} = {} if(!exists $ref->{$_});
$ref = $ref->{$_};
}
}
File::Find
modul funguje podobně jako unixový find
příkaz. JSON
modul vezme proměnné perlu a převede je na JSON.
find({wanted => &process_dir, no_chdir => 1 }, ".");
Iteruje dolů strukturu souboru z aktuálního pracovního adresáře a zavolá podprogram process_dir
pro každý soubor/adresář pod „.“ a no_chdir
řekněte perlu, aby nevydával chdir()
pro každý adresář, který najde.
process_dir
vrátí, pokud aktuální zkoumaný soubor není adresář:
return if !-d $File::Find::name;
Poté získáme odkaz na existující hash %$dirs
do $ref
, rozdělte cestu k souboru kolem /
a smyčka s for
přidání nového hash klíče pro každou cestu.
Vytvoření adresářové struktury jako slm:
mkdir -p dir{1..5}/dir{A,B}/subdir{1..3}
Výstup je:
{
"." : {
"dir3" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir2" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir5" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir1" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir4" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
}
}
}
Pokus 2
Dobře, nyní s jinou datovou strukturou…
#! /usr/bin/perl
use warnings;
use strict;
use JSON;
my $encoder = JSON->new->ascii->pretty; # ascii character set, pretty format
my $dirs; # used to build the data structure
my $path=$ARGV[0] || '.'; # use the command line arg or working dir
# Open the directory, read in the file list, grep out directories and skip '.' and '..'
# and assign to @dirs
opendir(my $dh, $path) or die "can't opendir $path: $!";
my @dirs = grep { ! /^[.]{1,2}/ && -d "$path/$_" } readdir($dh);
closedir($dh);
# recurse the top level sub directories with the parse_dir subroutine, returning
# a hash reference.
%$dirs = map { $_ => parse_dir("$path/$_") } @dirs;
# print out the JSON encoding of this data structure
print $encoder->encode($dirs);
sub parse_dir {
my $path = shift; # the dir we're working on
# get all sub directories (similar to above opendir/readdir calls)
opendir(my $dh, $path) or die "can't opendir $path: $!";
my @dirs = grep { ! /^[.]{1,2}/ && -d "$path/$_" } readdir($dh);
closedir($dh);
return undef if !scalar @dirs; # nothing to do here, directory empty
my $vals = []; # set our result to an empty array
foreach my $dir (@dirs) { # loop the sub directories
my $res = parse_dir("$path/$dir"); # recurse down each path and get results
# does the returned value have a result, and is that result an array of at
# least one element, then add these results to our $vals anonymous array
# wrapped in a anonymous hash
# ELSE
# push just the name of that directory our $vals anonymous array
push(@$vals, (defined $res and scalar @$res) ? { $dir => $res } : $dir);
}
return $vals; # return the recursed result
}
A pak spuštění skriptu v navržené adresářové struktuře…
./tree2json2.pl .
{
"dir2" : [
"dirB",
"dirA"
],
"dir1" : [
"dirB",
{
"dirA" : [
"dirBB",
"dirAA"
]
}
]
}
Zjistil jsem, že je to zatraceně složité správně (obzvláště s ohledem na logiku „hash, pokud podadresáře, pole, pokud ne, OH, POKUD nejvyšší úroveň, pak stejně jen hash“). Takže
bych byl překvapen, kdyby to bylo něco, co byste mohli udělat s sed
/ awk
… ale pak
Stephane se na to ještě nepodíval, vsadím se 🙂