6. července 2014
Makro pro úpravu naskenovaného textu
Sadu maker stáhnete ze stránek santiago.wz.cz
Makra (soubor zip) rozbalíme do adresáře STARTUP nebo "Po spuštění"
"C:\Program Files (x86)\Microsoft Office\Office14\STARTUP"
"C:\Users\Jmeno\AppData\Roaming\Microsoft\Word\Po spuštění"
Po spuštění Wordu se objeví nové menu "Knížka"
Tlačítkem "Pokračovat" provedete základní úpravu textu
Ve čtečce chceme mít spojené řádky i stránky
Užitečné je i nahrazení "překlepů" podle slovníku knizka_cz_slovnik.txt
a další kontroly naskenovaného textu
Regulární výrazy
Makro "Nahrazení výrazů dle slovníku" používá zástupné znaky (tzv. Regulární výrazy) definované v souboru knizka_zz_slovnik.txt
Regulární výrazy jsou nesmírně užitečným nástrojem pro zpracování textu, viz. Vyhledávání textu pomocí speciálních znaků
Ukázka jednoduchého výrazu, kdy po tečce chybí mezera:
najít: .([A-ž])
nahradit za: . \1
Tento výraz nahradí tečku mezi malými písmeny za čárku:
najít: ([a-ž]). ([a-ž])
nahradit za: \1, \2
Odstraní čísla stránek, tj. všechna čísla 0-999 na konci řádku:
najít: ([0-9]{1;3}[^13]) při zatrženém "Použít Zástupné znaky"
Nebo chceme spojit všechny řádky, které nekončí .?!":
najít: ([!.\?\!“":])^13
nahradit: \1_ (kde _ je mezera)
Přihlásit se k odběru:
Komentáře k příspěvku (Atom)
Žádné komentáře:
Okomentovat