Čeština je složitá, automat ji nezkrotí. Ale výrazně pomůže
24. července 2023
archiv
Čeština je složitý jazyk. Jediná čárka dokáže kompletně změnit význam věty. Vymyslet automatický nástroj, který by dovedl opravit všechny chyby, kterých se při psaní dopustíme, je tudíž nemožné. Nicméně se můžeme aspoň přiblížit. O což se snaží nový korektor jménem Opravidlo. Najde nejen překlepy, ale i chyby ve shodě podmětu s přísudkem nebo v interpunkci, říká vedoucí projektu Dana Hlaváčková z Masarykovy univerzity v Brně.
V Česku existují různé takzvané korektory, které však s pravopisem nemají nic společného a opravují jen překlepy. Kromě těch je u nás dlouhou dobu k dispozici korektor ve Wordu, nicméně jedná se o placený produkt, a ne každý jej tak může využívat. Navíc se už dlouhou dobu nevyvíjí a jeho opravy nejsou dostatečné. My jsme věděli, že by to šlo lépe, a také jsme věděli, jak to udělat. Naší prioritou bylo, aby v Česku vznikl korektor, který není vázaný na žádný komerční produkt, a je tak pro každého zdarma. Mimochodem, autoři korektoru ve Wordu do tohoto projektu šli s námi.
Samozřejmě opravuje překlepy, ale také pravopisné chyby, například v interpunkci. A potom chyby gramatické, jako například shodu podmětu s přísudkem. Dokáže zachytit i typografické chyby, na které se často nemyslí.
Typografické chyby souvisí s úpravou textu. Česká státní norma nám říká, jak máme text upravovat, kde mají být mezery, kde naopak být nemají, jak se správně píší interpunkční znaménka, závorky, uvozovky a další textové prvky. To jsou věci, které uživatelé velmi často opomíjí, a je to škoda, protože na textu je to vidět.
Typografie je ve Wordu opravdu velmi omezená, jsou tam samozřejmě nějaké opravy nadbytečných mezer, například mezera před tečkou a podobně. Ale Opravidlo by mělo zvládnout prakticky vše, co obsahuje česká státní norma. Některé věci se opravují automaticky, takže to vlastně uživatel ani nepostřehne. Může si je však zpětně nechat ukázat. Nicméně se takto opravují jen některé typografické chyby, například se spojují nedělitelné předložky a spojky se slovy, aby v textu fungovaly spolu a nerozdělily se na konci řádku. Drtivou většinu chyb systém v textu jen červeně podtrhne a navrhne alternativu. Uživatel pak musí rozhodnout, jestli opravu přijme, či ne.
To nemáme takto procentuálně vyčísleno. Opravidlo se skládá z několika modulů, přičemž každý z nich má jinou úspěšnost. Velmi úspěšný je například modul pro interpunkci, naopak méně úspěšný je modul pro opravu velkých písmen. Tam mnohdy záleží i na smyslu věty a pro automat je těžké to odhadnout. Snažíme se, aby těch falešně hlášených chyb bylo co nejméně, ale samozřejmě se objevují. Pokud se tak stane, mohou nám to uživatelé nahlásit. Program se tak snažíme stále vylepšovat.
Podpořte Reportér sdílením článku
Krom jiného se věnuje tématům spjatým se vzděláváním.