Koristite li Hašek? FER-ovci objavili koje su nam najčešće gramatičke i pravopisne pogreške

Objavio

L.A.

Petak, 14. siječnja 2022. u 14:10

Hrvatski akademski spelling checker Hascheck ili Hašek, dostupan na adresi ispravi.me, jedna je od najstarijih domaćih internetskih usluga koja već gotovo punih 30 godina svakodnevno pomaže akademskoj zajednici, brojnim novinskim redakcijama, ali i privatnim korisnicima u uređivanju njihovih tekstova.

Protekle godine usluzi je pristupilo 450 tisuća korisnika iz preko 130 zemalja svijeta, objavili su s Fakulteta elektrotehnike i računarstva gdje su i razvili omiljeni pravopisni alat.

Oni su obradili 8 milijuna tekstova koji su tvorili korpus od blizu 2 milijarde pojavnica. Ovo nedvojbeno govori o globalnoj popularnosti vrlo specifične usluge posvećene hrvatskom jeziku. Valja naglasiti da je hrvatski u svjetskim razmjerima “mali” jezik jer ga koristi manje od jednog promila svjetske populacije.

Najviše korisnika usluzi je pristupilo iz Hrvatske (83 %), zatim iz Bosne i Hercegovine (7 %), Njemačke (1 %) itd. Više od 40 % korisnika bilo je mlađe od 34 godine, a usluzi su u 75 posto slučajeva pristupali sa stolnog računala, najčešće radnim danima između 9 i 15 sati. Sve ovo upućuje da u Hrvatskoj treba posvećivati veću pozornost domaćem razvoju jezičnotehnoloških proizvoda i usluga, poručuju s FER-a.

Č i Ć nam zadaju glavobolju

U 2021. godini korisnici su najčešće griješili pri pisanju sljedećih riječi: če –> će, tiće –> tiče, riješenje –> rješenje, slijedeće –> sljedeće, mogučnosti –> mogućnosti, promjeniti –> promijeniti, čemo –> ćemo, več –> već, primjetiti –> primijetiti, djete –> dijete, samnom –> sa mnom, riješenja –> rješenja, reči –> reći, primjeniti –> primijeniti te razumijeti –> razumjeti.

Skrb o usluzi od samih početaka primarno počiva na idejnom začetniku, umirovljenom profesoru FER-a Šandoru Dembitzu, a u sklopu diplomskih i završnih radova na projektu povremeno sudjeluju i studenti FER-a.

30 godina učenja

Od početnih 100 tisuća različnica hrvatskog općejezičnog fonda, u gotovo 30 godina strogo nadziranog učenja sustav je narastao na 1,1 milijun različnica hrvatskog općejezičnog fonda te nešto više od milijun različnica hrvatskog posebnojezičnog, dominantno imenskog fonda. Posebnu vrijednost izvedenu iz obrada predstavlja hrvatski n-gramski sustav (n = 1, …, 7) u kojemu su pohranjeni sljedovi od n sukcesivnih riječi iz obrađivanih tekstova s potvrdom svake riječi u Hašekovu rječniku, upotpunjeno učestalošću pojedinog n-grama u ukupno obrađenome korpusu.

Hašekov n-gramski sustav, mjereno pojavnicama, višestruko nadmašuje opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas. Već ovaj podatak upućuje na vrijednost n-gramskog sustava u kontekstu suvremenih na big-data pristupima zasnovanih jezičnih obrada.

Koristite li Hašek? FER-ovci objavili koje su nam najčešće gramatičke i pravopisne pogreške

Č i Ć nam zadaju glavobolju

30 godina učenja

Najnoviji članci

Drama u tramvaju, Zagrepčanka se obranila kišobranom: ‘S turbanom na glavi, nabila sam ga’

Joško Lokas iznenadio emotivnom porukom: ‘Hvala gledateljima i ekipi’

Zbog nove dojave o bombi evakuiran Arena centar u Zagrebu

Powered by Zagreb.info

Industrijska priča o rastu KONČARA: Iz zagrebačkih pogona u svjetske elektroenergetske sustave

Gorenje premijerno na prestižnom sajmu EuroCucina

Nova adresa za ljubimce u Zagrebu: Otvara se Pet centar Kustošija

Proljetno piće za idealan piknik od sada u novom većem pakiranju

Tisuću hrastova za manji ugljični otisak: Zajedničkom aktivnošću djelatnici Kärchera stvorili nasljeđe za nadolazeće...

Izdvojeno

Uhićen muškarac: Vandalizirana pravoslavna crkva na Cvjetnom trgu u Zagrebu

Tena i Mihaela ponos su Zagreba: Pokorile svjetsku konkurenciju na prestižnom natjecanju

Zagreb planira veliki zaokret u stanogradnji: Evo gdje bi mogla niknuti nova naselja

Nesreća u centru grada prestravila Zagrepčanku: ‘Čula sam odvratan zvuk i okrenula se’

Karta divljih deponija: Ovo su mjesta u Zagrebu od kojih su građani napravili ilegalna...

INFO

Milorad Pupovac o razbijanju pravoslavne crkve u Zagrebu: ‘Noć nakon komemoracije u Jasenovcu’

Obitelj iz Zagreba traži nestalog Krešimira: ‘Pomozite mi pronaći oca, sve smo pokušali’

(Uživo) Burno na Skupštini, Tomašević ne odstupa ni milimetra: ‘Nećete dobiti zastave”

KC Dražen Petrović ponovno u funkciji: Popravljena oštećenja od oluje

Odjeknule slike 15 kvadrata u Zagrebu za koje traže 100 tisuća eura: ‘Potrebna renovacija’

Zagrepčanima ‘pukao film’ zbog korupcije: ‘Prepišite zakon ove države’

Zagreb planira veliki zaokret u stanogradnji: Evo gdje bi mogla niknuti nova naselja

Pratite nas na Instagram @zagreb.info