GitHub - nguyenq/VietOCR3: Java GUI frontend for Tesseract OCR engine

VietOCR

A Java GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract.

VietOCR is released and distributed under the Apache License, v2.0.

Features

Multi-platform
PDF, TIFF, JPEG, GIF, PNG, BMP image formats
Multi-page TIFF images
Screenshots
Selection box
File drag-and-drop
Paste image from clipboard
Text search and replace
Postprocessing for Vietnamese to boost accuracy rate
Vietnamese input methods
Localized user interface for many languages (Localization project)
Integrated scanning support
Watch folder monitor for support of batch processing
Custom text replacement in postprocessing
Spellcheck with Hunspell
Support for downloading and installing language data packs and appropriate spell dictionaries

Instructions

To launch the program from the command line:

java -jar VietOCR.jar

or for CLI option:

java -jar VietOCR.jar imagefile outputfile [-l lang] [--psm pagesegmode] [text|hocr|pdf|pdf_textonly|unlv|box|alto|page|tsv|lstmbox|wordstrbox] [postprocessing] [correctlettercases] [deskew] [removelines] [removelinebreaks]

Name		Name	Last commit message	Last commit date
Latest commit History 827 Commits
.tx		.tx
data		data
dict		dict
lib		lib
nbproject		nbproject
samples		samples
src		src
tessdata		tessdata
test/net/sourceforge/vietocr		test/net/sourceforge/vietocr
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
build.xml		build.xml
jacob-1.20-x64.dll		jacob-1.20-x64.dll
jacob-1.20-x86.dll		jacob-1.20-x86.dll
manifest.mf		manifest.mf
ocr		ocr
ocr.bat		ocr.bat
readme.html		readme.html
readme_bn.html		readme_bn.html
readme_ca.html		readme_ca.html
readme_cs.html		readme_cs.html
readme_de.html		readme_de.html
readme_en_GB.html		readme_en_GB.html
readme_et.html		readme_et.html
readme_fa.html		readme_fa.html
readme_fr.html		readme_fr.html
readme_hi.html		readme_hi.html
readme_it.html		readme_it.html
readme_ja.html		readme_ja.html
readme_kn.html		readme_kn.html
readme_lt.html		readme_lt.html
readme_ne.html		readme_ne.html
readme_nl.html		readme_nl.html
readme_pl.html		readme_pl.html
readme_pt.html		readme_pt.html
readme_ru.html		readme_ru.html
readme_sd.html		readme_sd.html
readme_sk.html		readme_sk.html
readme_tr.html		readme_tr.html
readme_vi.html		readme_vi.html
readme_zh_Hans.html		readme_zh_Hans.html
versionchanges.txt		versionchanges.txt
wiaaut.dll		wiaaut.dll

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VietOCR

Features

Instructions

Dependencies

About

Releases 65

Packages

Contributors 3

Languages

nguyenq/VietOCR3

Folders and files

Latest commit

History

Repository files navigation

VietOCR

Features

Instructions

Dependencies

About

Resources

Stars

Watchers

Forks

Releases 65

Packages 0

Contributors 3

Languages

Packages