GNU/Linux >> Znalost Linux >  >> Linux

Nástroj pro kontrolu gramatiky pro použití s ​​LaTeXem?

(Není příliš zdvořilé odpovídat na vlastní otázky, ale tím jsem skončil.)

LanguageTool je velmi pěkný samostatný nástroj na kontrolu gramatiky založený na Javě. Funguje však na prostý text. Proto jsem potřeboval převést svůj LaTeXový dokument na co nejprostší textový dokument - Není to jednoduchý úkol. Podařilo se mi to pomocí následujícího triku:

  1. Zařídil jsem, aby všechny plováky držely své pozice pomocí balíčku floats a možnosti H. To je vyžadováno, aby titulky při transformaci na prostý text nelámaly odstavce.
  2. Odstranil jsem čísla řádků pomocí balíčku nopageno.
  3. Použil jsem skript sed k dalšímu doladění, jako je přidání teček do názvů sekcí a popisků. Scénář zde nezveřejňuji, protože je skutečně specifický pro můj vlastní styl a konvence.
  4. Po tomto předběžném zpracování jsem zkompiloval do DVI a spustil catdvi -s .
  5. Použil jsem další jednoduchý skript sed, abych se zbavil prázdných řádků a zalomení stránek. Konečným výsledkem je rozumná textová konverze dokumentu LaTeX, na kterém může LanguageTool pracovat.

Stále jsou tu nějaké nepříjemnosti, jako jsou vložené výpisy programů, kterým kontrola gramatiky nerozumí, ale dohromady jsem z toho dostal slušnou automatickou kontrolu :)


Napsal jsem gramatiku pro kontrolu TeXových dokumentů s názvem LyX-GC. Lze jej také použít online jako webovou aplikaci.

Jako back-end může používat LanguageTool. Hlavní výhody oproti pouhému přímému použití LanguageTool jsou v tom, že (1) filtruje TeX, aby se vyhnul falešným poplachům z LanguageTool, který se snaží interpretovat příkazy TeXu jako anglické, a (2) má stovky vlastních pravidel, včetně pravidel specifických pro TeX. Například ví, že "See \ref{lem:foo} " by skutečně mělo být "See Lemma \ref{lem:foo} ". (Také, pokud používáte LyX, LyX-GC má samozřejmě výhodu v možnosti integrace s LyX.)

LyX-GC skutečně podporuje pouze angličtinu (ačkoli v repozitáři git existuje experimentální podpora francouzštiny).


Právě jsem dokončil psaní nového nástroje pro kontrolu pravopisu a gramatiky přímo v souborech LaTeX, nazvaný TeXtidote :

https://sylvainhalle.github.io/textidote

Program může odstranit označení ze souboru a odeslat je do knihovny Language Tool, která provádí ověření pravopisu a gramatiky v tuctu jazyků. Jedinečné pro TeXtidote je to, že sleduje relativní polohu slov mezi původním a „čistým“ textem. To znamená, že dokáže přeložit zprávy z Language Tool zpět do jejich správného umístění přímo ve zdrojovém souboru. Ve výchozím nastavení TeXtidote vytváří HTML zprávu, která zobrazuje vaše původní zdroje, přičemž chyby nalezené Language Tool jsou zvýrazněny na správném místě:

Nástroj je zdarma a snadno se instaluje (nezávislý na OS, vyžaduje Java). Doporučuji vám to zkusit a říct mi, co si myslíte! (Více informací o stahování/instalaci/používání lze nalézt na stránce Readme repozitáře GitHub; kliknutím na tlačítko „Stáhnout“ na webové stránce se tam dostanete.)


Linux
  1. nástroj podobný teamvieweru pro ssh?

  2. Použijte IP kameru s webRTC

  3. Jak vypsat názvy tiskáren přijatelné pro použití s ​​lpr?

  1. 3 tipy pro tisk s Linuxem

  2. Virtualizace na PC, vysvětlení pro začátečníky s praktickými příklady použití

  3. Převést heslo se speciálními znaky pro použití s ​​Expect Script?

  1. Začínáme se socatem, víceúčelovým přenosovým nástrojem pro Linux

  2. Jak nainstalovat PhantomJS pro použití s ​​Python Selenium na Raspberry Pi?

  3. Použít cloud-init s VirtualBoxem?