6. července 2014

Makro pro úpravu naskenovaného textu


Sadu maker stáhnete ze stránek santiago.wz.cz

Makra (soubor zip) rozbalíme do adresáře STARTUP nebo "Po spuštění"
"C:\Program Files (x86)\Microsoft Office\Office14\STARTUP"
"C:\Users\Jmeno\AppData\Roaming\Microsoft\Word\Po spuštění"


Po spuštění Wordu se objeví nové menu "Knížka"

 Tlačítkem "Pokračovat" provedete základní úpravu textu

 Ve čtečce chceme mít spojené řádky i stránky


Užitečné je i nahrazení "překlepů" podle slovníku knizka_cz_slovnik.txt



a další kontroly naskenovaného textu

Regulární výrazy

Makro "Nahrazení výrazů dle slovníku" používá zástupné znaky (tzv. Regulární výrazy) definované v souboru knizka_zz_slovnik.txt
Regulární výrazy jsou nesmírně užitečným nástrojem pro zpracování textu, viz. Vyhledávání textu pomocí speciálních znaků

Ukázka jednoduchého výrazu, kdy po tečce chybí mezera:
najít: .([A-ž])
nahradit za: . \1
Tento výraz nahradí tečku mezi malými písmeny za čárku:
najít: ([a-ž]). ([a-ž])
nahradit za: \1, \2
Odstraní čísla stránek, tj. všechna čísla 0-999 na konci řádku:
najít: ([0-9]{1;3}[^13]) při zatrženém "Použít Zástupné znaky"
Nebo chceme spojit všechny řádky, které nekončí .?!":
najít: ([!.\?\!“":])^13
nahradit: \1_ (kde _ je mezera)


Žádné komentáře: