OU Portal
Log In
Welcome
Applicants
Z6_60GI02O0O8IDC0QEJUJ26TJDI4
Error:
Javascript is disabled in this browser. This page requires Javascript. Modify your browser's settings to allow Javascript to execute. See your browser's documentation for specific instructions.
{}
Zavřít
Publikační činnost
Probíhá načítání, čekejte prosím...
publicationId :
tempRecordId :
actionDispatchIndex :
navigationBranch :
pageMode :
tabSelected :
isRivValid :
Typ záznamu:
stať ve sborníku (D)
Domácí pracoviště:
Ústav pro výzkum a aplikace fuzzy modelování (94410)
Název:
Acquiring custom OCR system with minimalmanual annotation
Citace
Adamczyk, D., Hůla, J., MOJŽÍŠEK, D. a Čech, R. Acquiring custom OCR system with minimalmanual annotation.
In:
3rd IEEE International Conference on Data Stream Mining and Processing, DSMP 2020: Proceedings of the 2020 IEEE 3rd International Conference on Data Stream Mining and Processing 2020-08-21 Kijev, Ukrajina.
IEEE, 2020. s. 231-236. ISBN 978-172813214-3.
Podnázev
Rok vydání:
2020
Obor:
Informatika
Počet stran:
6
Strana od:
231
Strana do:
236
Forma vydání:
Elektronická verze
Kód ISBN:
978-172813214-3
Kód ISSN:
Název sborníku:
Proceedings of the 2020 IEEE 3rd International Conference on Data Stream Mining and Processing
Sborník:
Mezinárodní
Název nakladatele:
IEEE
Místo vydání:
neuvedeno
Stát vydání:
Název konference:
3rd IEEE International Conference on Data Stream Mining and Processing, DSMP 2020
Místo konání konference:
Kijev, Ukrajina
Datum zahájení konference:
Typ akce podle státní
příslušnosti účastníků akce:
Celosvětová akce
Kód UT WoS:
EID:
2-s2.0-85093687591
Klíčová slova anglicky:
Historical Texts; Neural Networks; OCR; Synthetic Data
Popis v původním jazyce:
We describe a development of a custom OCR system, which is designed specifically for a linguistic analysis of texts printed during the early modern period. This analysis requires precise detection of individual graphemes, and we, therefore, could not apply standard approaches that transcribe whole lines in an end-to-end fashion. We also describe our use of synthetically generated images, which allow us to avoid manual annotation of a large training set.
Popis v anglickém jazyce:
We describe a development of a custom OCR system, which is designed specifically for a linguistic analysis of texts printed during the early modern period. This analysis requires precise detection of individual graphemes, and we, therefore, could not apply standard approaches that transcribe whole lines in an end-to-end fashion. We also describe our use of synthetically generated images, which allow us to avoid manual annotation of a large training set.
Seznam ohlasů
Ohlas
R01:
RIV/61988987:17610/20:A210268A
Complementary Content
Deferred Modules
${title}
${badge}
${loading}
Deferred Modules