GNU/Linux >> Znalost Linux >  >> Linux

Jak převést formáty souborů pomocí Pandoc v Linuxu [Rychlý průvodce]

V dřívějším článku jsem popsal postup dávkového převodu několika souborů Markdown do HTML pomocí pandoc. V tomto článku bylo vytvořeno více souborů HTML, ale pandoc umí mnohem více. Říká se mu „švýcarský armádní nůž“ konverze dokumentů – a má to dobrý důvod. Není toho mnoho, co by to nezvládlo.

Pandoc dokáže překrýt .docx, .odt, .html, .epub, LaTeX, DocBook atd. do těchto a dalších formátů, jako jsou JATS, TEI Simple, AsciiDoc a další.

Ano, to znamená, že pandoc umí převádět soubory .docx na .pdf a .html, ale možná si říkáte:„Word umí exportovat soubory do .pdf a .html také. Proč bych potřeboval pandoc?“

Měli byste dobrý názor, ale protože pandoc dokáže převést tolik formátů, mohl by se dobře stát vaším oblíbeným nástrojem pro všechny vaše konverzní úkoly. Mnoho z nás například ví, že editoři Markdown mohou exportovat jeho soubory Markdown do .html. Pomocí pandoc lze soubory Markdown převést také do mnoha dalších formátů.

Zřídka mám Markdown export do HTML; Normálně to nechám udělat pandoc.

Převod formátů souborů pomocí Pandoc

Zde převedu soubory Markdown do několika různých formátů. Téměř všechno píšu pomocí syntaxe Markdown, ale často musím převádět do jiného formátu:soubory .docx jsou obvykle vyžadovány pro školní práci, .html pro webové stránky, které vytvářím – a pro práci ve formátu .epub, .pdf pro letáky a letáky a dokonce i příležitostný soubor TEI Simple pro univerzitní digitální humanitní projekt. Pandoc zvládne všechny tyto a další snadno.

Nejprve musíte nainstalovat pandoc. K vytvoření souborů .pdf bude také potřeba LaTeX. Balíček, který preferuji, je TeX Live.

Poznámka :Pokud byste si chtěli pandoc před instalací vyzkoušet, existuje online zkušební stránka na adrese:http://pandoc.org/try/

Instalace pandoc a texlive

Uživatelé Ubuntu a dalších distribucí Debianu mohou do terminálu zadat následující příkazy:

sudo apt-get update
sudo apt-get install pandoc texlive

Všimněte si na druhém řádku, instalujete pandoc a texlive najednou. příkaz apt-get s tím nebude mít problém, ale jděte si dát kávu; může to trvat několik minut.

Jak se dostat ke konverzi

Jakmile jsou pandoc a texlive nainstalovány, můžete spálit nějakou práci!

Ukázkovým dokumentem pro tento projekt bude článek, který byl poprvé publikován v North American Review v prosinci 1894 a nese název:„Jak odrazit vlakové lupiče“. Soubor Markdown, který budu používat, byl vytvořen před časem jako součást projektu obnovy.

Soubor:how_to_repel_train_robbers.md se nachází v adresáři Dokumenty, v podadresáři s názvem sample. Tady je, jak to vypadá v Ghostwriter.

Chci vytvořit verze .docx, .pdf a .html tohoto souboru.

První konverze

Nejprve začnu vytvořením kopie .pdf, protože jsem si prošel problémy s instalací balíčku LaTeX.

V adresáři ~/Documents/samples/ zadávám následující, abych vytvořil soubor .pdf:

pandoc -o htrtr.pdf how_to_repel_train_robbers.md

Výše uvedený příkaz vytvoří soubor s názvem htrtr.pdf ze souboru how_to_repel_train_robbers.md. Důvod, proč jsem jako název použil htrtr, byl ten, že je kratší než how_to_repel_train_robbers – htrtr je první písmeno každého slova v dlouhém názvu.

Zde je snímek souboru .pdf, jakmile bude vytvořen:

Druhá konverze

Dále chci vytvořit soubor .docx. Příkaz je téměř totožný s tím, který jsem použil k vytvoření .pdf a je:

pandoc -o htrtr.docx how_to_repel_train_robbers.md

Během okamžiku je vytvořen soubor .docx. V Libre Writer to vypadá takto:

Třetí konverze

Možná to budu chtít zveřejnit na webu, takže nějaká webová stránka by byla fajn. Vytvořím soubor .html pomocí tohoto příkazu:

pandoc -o htrtr.html how_to_repel_train_robbers.md

Opět platí, že příkaz k jeho vytvoření je velmi podobný posledním dvěma převodům. Takto vypadá soubor .html v prohlížeči:

Už jste si něčeho všimli?

Podívejme se znovu na minulé příkazy. Byli to:

pandoc -o htrtr.pdf how_to_repel_train_robbers.md
pandoc -o htrtr.docx how_to_repel_train_robbers.md
pandoc -o htrtr.html how_to_repel_train_robbers.md

Jediná věc, která se na těchto třech příkazech liší, je rozšíření vedle htrtr. To vám dává nápovědu, že pandoc se spoléhá na příponu výstupního souboru, který zadáte.

Závěr

Pandoc umí mnohem více než tři malé konverze provedené zde. Pokud píšete v preferovaném formátu, ale potřebujete převést soubor do jiného formátu, je velká šance, že pandoc to udělá za vás.

co bys s tím udělal? Zautomatizovali byste to? Co kdybyste měli webovou stránku s články, které si vaši čtenáři mohou stáhnout? Tyto malé příkazy můžete upravit tak, aby fungovaly jako skript, a vaši čtenáři se mohli rozhodnout, jaký formát by chtěli. Můžete nabídnout .docx, .pdf, .odt, .epub nebo další. Vaši čtenáři si vyberou, spustí se správný konverzní skript a vaši čtenáři si stáhnou svůj soubor. Dá se to udělat.



Linux
  1. Jak vytvořit soubor s danou velikostí v Linuxu?

  2. Jak převést výstup shellu Linuxu do HTML?

  3. Jak napsat soubor s C v Linuxu?

  1. Jak převést soubory do kódování UTF-8 v Linuxu

  2. Jak nahradit soubor v jar příkazovým řádkem v linuxu?

  3. Jak smazat soubor s tímto názvem na linuxu:-]???????q

  1. Linux + Jak ignorovat (filtrovat) soubor s mezerou?

  2. Jak přejmenovat soubor v Linuxu?

  3. Jak vytvořit systém souborů ZFS pomocí komprese souborů v systému Linux