- Source công khai, tuy khá đầy đủ nhưng anh em cần cải tiến nó ( tham gia ĐM EOP.)
- Không phụ thuộc vào cấu trúc câu hỏi, miễn còn ra đáp án là còn dùng được.
- Theo dõi kênh này để cập nhật liên tục
- Nếu muốn chạy code thì phải cài thêm Python, nếu chỉ chạy file .exe thì chỉ cần làm theo hướng dẫn.
- Hướng dẫn cài đặt
- Hướng dẫn sử dụng
- Hoặc tham gia vào nhóm cộng đồng để xem video hướng dẫn ở phần ghim: ĐM EOP.
-
Tải xuống trình cài đặt Tesseract cho Windows từ https://github.com/UB-Mannheim/tesseract/releases/download/v5.4.0.20240606/tesseract-ocr-w64-setup-5.4.0.20240606.exe
-
Chạy tệp cài đặt vừa tải xuống và làm theo hướng dẫn trên màn hình.
-
Khi cài đặt xong, đảm bảo rằng thư mục chứa
tesseract.exe
đã được thêm vào biến môi trường PATH. Thông thường, thư mục này làC:\Program Files\Tesseract-OCR
hoặc tương tự.- Để thêm vào PATH, mở Control Panel > System and Security > System > Advanced system settings > Environment Variables. Trong phần System variables, tìm biến
Path
, chọn và nhấn Edit, sau đó thêm đường dẫnC:\Program Files\Tesseract-OCR
.
- Để thêm vào PATH, mở Control Panel > System and Security > System > Advanced system settings > Environment Variables. Trong phần System variables, tìm biến
-
Kiểm tra việc cài đặt bằng cách mở Command Prompt và chạy lệnh:
tesseract --version
-
Tải file dữ liệu dùng cho font chữ ( đã trained riêng cho eop ): eng.zip
-
Giải nén
eng.zip
, copy fileeng.traineddata
vào thư mụcC:\Program Files\Tesseract-OCR\tessdata
Nếu gặp vấn đề, hãy tìm kiếm lỗi trên Google hoặc YouTube để tìm giải pháp.
-
Truy cập trang chính thức của FFmpeg: ffmpeg.org.
-
Giải nén tệp tải về vào một thư mục, chẳng hạn như
C:\ffmpeg
. -
Thêm thư mục chứa
ffmpeg.exe
vào biến môi trường PATH:- Mở Control Panel > System and Security > System > Advanced system settings > Environment Variables.
- Trong phần System variables, tìm biến
Path
, chọn và nhấn Edit, sau đó thêm đường dẫn đến thư mục chứaffmpeg.exe
(ví dụ:C:\ffmpeg\bin
).
-
Kiểm tra việc cài đặt bằng cách mở Command Prompt và chạy lệnh:
ffmpeg -version
Nếu gặp vấn đề, hãy tìm kiếm lỗi trên Google hoặc YouTube để tìm giải pháp.
- Tải xuống thư mục và giải nén DMEOP.exe
- Di chuyển ứng dụng ra ngoài desktop hoặc nơi muốn đặt và sử dụng
- Nhập thời gian chờ ngẫu nhiên (Mặc định là 30 giây đến 60 giây)
- Nhập thông tin và ấn nút Start tương ứng
- Lưu ý: Lần chạy đầu tiên sẽ mất chút thời gian.
- Tham gia vào cộng đồng để giao lưu và trao đổi: ĐM EOP.
Ứng dụng thực hiện mô phỏng thao tác khi làm bài của người dùng (selenium), vậy nên có thể hiểu đơn giản, nó là người dùng ảo được lập trình để làm tự động. Không can thêm sửa xóa cấu trúc của website => không bị cảnh báo vi phạm.
Lý do cài đặt thêm 2 thư viện nữa là:
- Tesseract .exe chạy trên náy tính cá nhân, giúp đọc kết quả có hiệu năng tốt nhất, không tốn tài nguyên mạng. Đặc biệt, nó nhận file traineddata mà mình train cẩn thận từ font chứ phần đáp án.
- ffmpeg, nó giúp chuyển phần âm thanh từ bài nghe và sắp xếp từ vựng thành chữ.
Sau khi cài xong. Có thể sẽ xuất hiện cảnh báo của window ứng dụng không rõ nguồn gốc, mọi người có thể tạm tắt window defender trước khi chạy hoặc cho phép ứng dụng hoạt động.
Nên cài 2 thư viện bên ngoài trước khi chạy ứng dụng. Có thể sẽ cần khởi động lại máy tính.
Source code kèm hướng dẫn: https://github.com/linux-vps/DMEOP
File ứng dụng exe: https://drive.google.com/file/d/1yOORhyZN7veO87kSA3VU-GGPr3Y0pCfF/view?usp=sharing
Group cộng đồng hỗ trợ: https://www.facebook.com/groups/370817769403735
- Sử dụng Selenium với Python để mô phỏng thao tác khi làm bài bằng tay.
- Đã sử dụng qua 3 kì, vừa trải nghiệm vừa cải tiến.
- Khá nặng, 1GB, sẽ nhẹ hơn nếu anh em nào cải tiến thành sử dụng API với JS, tuy nhiên nếu dùng JS thì cần triển khai server OCR vì phải phụ thuộc vào traineddata, tuy chạy được với thư viện tesseract.js nhưng hiệu quả nhất vơi Tesseract cài trên hệ điều hành.
- Mang tính chất học tập và nghiên cứu. có thể trao đổi tại group ĐM EOP.