Tekstituvastus

Erinevate tekstituvastusmudelite tuvastustäpsuse hindamine Levenshteini meetodil


Eesti Kirjandusmuuseumi veebilehe "Tekstituvastus" alamjaotises esitatakse võrdlevalt erinevate mudelite tekstituvastustäpsusi. Võrdleva meetodina kasutatakse üht võimalikku tekstituvastustäpsuse hindamismõõdikut Levenshteini skoori.

Kõrvuti laiemalt tuntud teenusepakkujate arendatud mudelitega on välja toodud Eesti Kirjandusmuuseumi enda täiustatud ja treenitud modulaarsed tuvastusmudelid.

Mudelite arendamise peamiseks eesmärgiks on tagada tervikuna parem ligipääsetavus Eesti kultuuriloolisele ainesele, millele kõrval oleks võimalik lisaks pakkuda erinevaid tekstituvastusega ja digiteerimisega seotud teenuseid ka laiemale üldsusele.

Esimese arendatud mudeli nimeks sai "Kirjandusmuuseumi keelemudel Aino". Mudelitele nime määramisel lähtutakse põhimõttest, milles esimene silp "AI" viitab tehisarule ja mis koos nime järgneva osaga moodustaks kokku arhailise soome-ugri nime nagu Aino, Aita, Aime jne.

Veebilehel esitatud testide tulemusi uuendatakse jooksvalt, sõltuvalt uute mudelite ja versioonide edasiarendustest.


Kas leidsid, mida otsisid? *