Vaše ukázkové soubory jsou ve správném formátu XHTML. Vynikající! To znamená, že můžete použít jednoduchý skript XSLT. Viz Jak sloučit dva soubory XML pomocí XSLT
Použijte pandoc ke sloučení např. všechny html soubory v aktuálním adresáři:
pandoc -s *.html -o output.html
Můžete použít nástroj html-merge ke sloučení více souborů HTML při zachování jejich vnitřních hypertextových odkazů. Je to program win32, ale můžete ho spustit v linuxu pomocí Wine. Stránka ke stažení:https://sourceforge.net/projects/htmlmg/files/