Các kĩ thuật xử lí văn bản trong quá trình làm eBook
Khi chuyển đổi (convert) qua lại giữa các định dạng eBook thì sai định dạng, phát sinh lỗi là vấn đề không thể tránh khỏi. Có một số lỗi sửa nhanh nhưng cũng có một số lỗi làm đau đầu các Converter cũng như Builder. Do đó mình xin phép chia sẻ kinh nghiệm để xử lí một số lỗi cơ bản hay gặp, với sự đầu tư nghiêm túc và tinh thần sẻ chia.
Một số lỗi đó là:
- Lỗi bị dòng trắng quá nhiều, bị đúp dòng.
- Lỗi bị đúp khoảng trống giữa các từ, khoảng trống không đều.
- Lỗi bị bẻ câu, ngắt câu, ngắt từ tùy tiện.
Đây là 1 tài liệu dài và bị lỗi nham nhở nhưng tất cả thao tác chỉ mất có 20s là xong? Bằng cách nào và phương pháp ra sao, xin mời các bạn tham khải tài liệu do mình viết ở bên dưới.
Cái này phải xử lí trên notepad ++, nhiều lúc gặp trường hợp lỗi font cũng mệt. Giá mà có cách như này trên word luôn thì tốt, đang gặp lỗi xuống dòng lung tung.
đọc xong hướng dẫn của chủ thớt ka nhận xét một điều:
cái hướng dẫn của chú rất tốt nhưng cần sửa hết lại toàn bộ từ đầu đến cuối thì hợp lý hơn :)
@tetema: word xử lý text cực kỳ kém và cực kỳ chậm, chậm hơn N++ mấy nghìn lần :sure:
vậy nên ta chỉ dùng word để chạy macro đánh mục lục và thiết kế trang Info cho nó màu mè thôi.
Lỗi font là do lúc copy vào N++ chưa chuyển encode sang UTF-8 mà vẫn để nguyên ANSI