Nếu đây là lần đầu bạn ghé thăm diễn đàn, xin mời bạn xem phần Hướng dẫn đọc và xem eBook. Hoặc bạn cũng có thể ghi danh để theo dõi và tham gia thảo luận cùng chúng tôi.
| Dự án ebook cho Thư viện Mời các thành viên có mong muốn giúp sức cho TV để làm sách xin mời vào đây |
![]() |
|
|
#1 |
|
Thủ thư
|
Thân chào các bạn!
Để các bạn có những thông tin, kiến thức cơ bản khi tham gia góp sức tạo ebook cho Thư viện, cũng như nhằm chuẩn hóa quy trình tạo ebook, Ban Quản Lý Thư viện Ebook đưa ra một số nội dung được trình bày theo từng chủ đề, như dưới đây: Ghi chú: - Nội dung bài viết dựa trên cơ sở những quy định của Thư viện, sử dụng các góp ý, chia sẻ kinh nghiệm của các thành viên trong suốt thời gian qua. - Các bạn vui lòng tham khảo trước khi tiến hành dự án, đồng thời, cung cấp link bải viết này cho các bạn cùng nhóm để dự án tiến hành hiệu quả nhất. - Ban Quản Lý luôn hoan nghênh ý kiến đóng góp của các bạn, các thông tin hữu ích sẽ được chúng tôi cập nhật kịp thời. Và để tránh loãng nội dung của Thread, các bài viết góp ý trong thread này, sau khi chúng tôi tiếp nhận và xử lý thông tin, sẽ được xóa, mong các bạn thông cảm. A. NHỮNG QUY ĐỊNH TRONG VIỆC TẠO EBOOK I. Mẫu thông tin ebook: Một ebook hoàn chỉnh yêu cầu có đầy đủ các thông tin sau: Tên sách: Tác giả: Nhà xuất bản: Năm xuất bản: Số trang: Giá tiền: Khổ: --------- Đánh máy: Sửa chính tả: Chuyển sang ebook: Ngày hoàn thành: http://www.e-thuvien.com Ví dụ: ![]() - Trường hợp dữ liệu được lấy từ các nguồn khác, các bạn vui lòng ghi rõ, nhằm tôn trọng người đã cung cấp dữ liệu, cũng như tránh các khiếu kiện về sau. - Cố gắng có ảnh bìa minh họa để ebook thêm hấp dẫn. II. Nguyên tắc cơ bản về định dạng: - Sử dụng bảng mã Unicode (Unicode tổ hợp càng tốt). o Lưu ý: các bảng mã khác sẽ bị lỗi font do không tương thích khi chuyển sang ebook định dạng .prc). - Kích thước chữ là 12pt cho phần văn bản, tối đa là 16pt cho tiêu đề. - Kiểu chữ Times New Roman. - Phải trung thành với bản in (nội dung, chính tả,...), đầy đủ chú thích, hình ảnh (nếu có). - Các thay đổi về hình thức so với sách giấy có thể được chấp nhận, nhưng phải bảo đảm không làm ảnh hưởng đến nội dung. - Tạo mục lục (index) cho ebook. Tham khảo hướng dẫn chi tiết tại đây Lưu ý: Các bạn nhớ dùng chức năng “tìm kiếm” trên diễn đàn, hoặc dùng Google để tránh làm ebook đã có. Ví dụ: Bạn dự định làm cuốn “Người đọc”, kiểm tra bằng lệnh [“người đọc” site:e-thuvien.com] như hình sau: ![]() thay đổi nội dung bởi: Becon53, 04-04-2009 lúc 12:04 PM |
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
|
|
#2 |
|
Thủ thư
|
B. GỢI Ý MỘT SỐ PHƯƠNG PHÁP TẠO EBOOK: I. Đánh máy: Sau đây là gợi ý các bước thực hiện: 1. Thành viên chủ trì dự án (có sách giấy, dữ liệu gốc, hoặc bản scan, ảnh chụp,..): đăng bài thông báo thực hiện dự án mời mọi người cùng tham gia trên Box “Dự án ebook cho Thư viện”. Cung cấp thông tin liên lạc dễ nhất như nick Yahoo, địa chỉ mail, hoặc ít nhất phải bật chế độ nhận tin nhắn riêng (PM) trên Thư viện. ![]() 2. Các thành viên muốn tham gia viết bài đăng ký tham gia, cung cấp địa chỉ liên lạc hoặc liên lạc trực tiếp với chủ dự án để nhận phần việc phù hợp (chụp ảnh, hoặc đánh máy, hoặc kiểm tra chính tả, ...) 3. Chủ dự án, hoặc các bạn có sách chuẩn bị các file scan hoặc file ảnh chụp để phân chia gói công việc cho các bạn không có sách. Cập nhật tình hình phân công và tiến trình dự án trong bài đầu tiên để các thành viên dễ theo dõi. Thông báo thời hạn cuối cho mỗi gói công việc. Ghi chú: - Gợi ý khi chụp ảnh: Các bạn dùng máy chụp Kỹ Thuật Số, để chế độ Macro (chụp cận cảnh), không mở đèn Flash, chụp dưới ánh sáng trời sẽ cho kết quả tốt nhất. Khi chụp chọn độ phân giải cao để ảnh đẹp. Sau đó, resize lại khoảng 100-200kb/ảnh cho nhẹ, dễ gởi mail. - Mỗi phần việc khoảng 20 - 50 trang là phù hợp với khả năng của đa số các bạn tham gia. - Các thành viên nhận file và thông báo thời hạn nộp lại cho chủ dự án. - Các bạn copy ảnh vào Word để vừa nhìn vừa gõ ngay trong Word (ảnh 1), hoặc mở song song cùng lúc 2 cửa sổ Word và ảnh để gõ (ảnh 2) Ảnh 1: Copy ảnh vào word, vừa nhìn vừa gõ. ![]() Ảnh 2: Mở song song 2 cửa sổ: ảnh và word để gõ. ![]() 4. Các thành viên đánh máy trong Word, tuân thủ các quy định về kích thước chữ, kiểu chữ, bảng mã. Lưu ý: Chỉ nên gõ dữ liệu thô, không format. Công việc này sẽ thực hiện 1 lần bởi 1 thành viên để toàn văn bản được thống nhất. 5. Phân công kiểm tra lỗi chính tả. 6. Phân công format và đóng gói thành ebook .prc. Cách đóng gói ebook .prc, các bạn tham khảo mục hướng dẫn của Thư viện. 7. Đưa ebook lên Box phù hợp, kèm theo thông báo hoàn tất dự án tại box “Dự án ebook cho thư viện”. Ghi chú: Một số kinh nghiệm các chủ dự án cần lưu ý: - Giao việc và giữ liên lạc với các thành viên trong nhóm để hỗ trợ khi cần thiết. - Không giao quá nhiều việc cùng lúc cho 1 người. - Cung cấp thời hạn cho mỗi thành viên tùy theo khả năng từng người, tránh tình trạng vỡ kế hoạch, làm giảm nhiệt tình các thành viên khác. - Trường hợp có quá ít bạn đăng ký tham gia, hoặc có bất kỳ vướng mắc nào, chủ dự án liên lạc với Quản lý Box (hiện tại là Becon53) để được giúp đỡ. - Trường hợp chủ dự án không có nhiều thời gian, có thể đề nghị 1 thành viên trong nhóm làm thay vai trò của mình để tránh mất liên lạc hoặc trì trệ dự án. Ghi chú về việc sử dụng Thư viện làm nơi up và down dữ liệu khi thực hiện dự án: Để hỗ trợ công việc làm dự án, chúng tôi đề xuất việc chia sẻ dữ liệu giữa chủ dự án và các thành viên với nhau, tạm thời trong thời gian thực hiện ebook, như sau: - Chủ dự án có thể up thẳng lên bài viết các file dữ liệu để phân công cho các thành viên (file ảnh, file scan, file word, …) - Các file dữ liệu đã hoàn thành (.doc) cũng có thể up trực tiếp lên để chủ dự án down về. - Sẽ xóa bỏ các file đính kèm đó sau khi xử lý xong. |
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
|
|
#3 |
|
Thủ thư
|
B. GỢI Ý MỘT SỐ PHƯƠNG PHÁP TẠO EBOOK: (tiếp theo) II. Sử dụng phần mềm nhận dạng VnDORC 4.0 1.Link download phần mềm (Bản full có giá khoảng 8 triệu :P, đây là bản Demo, cho nhận dạng nhưng không cho copy): http://quansuvietnam.googlepages.com/home http://www.vndocr.com/home/Products.asp?ProductID=2 2.Hướng dẫn sử dụng: a. Yêu cầu: - Có phần mềm nhận dạng VnDORC (gợi ý dùng version 4.0). - Có sách giấy để chuyển qua file ảnh hoặc file scan định dạng .tif. Ghi chú: Phương pháp sử dụng Vnodcr từ file ảnh chụp (.jpg), hoặc file .pdf được hướng dẫn ở bài viết số 4. b. Bước thực hiện: Bước 1: Scan hoặc chụp văn bản ở chế độ “Black and White”, độ phân giải từ 300 dpi trở lên, và lưu file có đuôi là .tif. Lưu ý: Vndocr chỉ cho nhận dạng 3 trang 1 lần nên các bạn lưu ý tách các file .tif thành từng trang sẽ dễ thao tác hơn, có thể dùng phần mềm sau http://www.coolutils.com/Tiff-Paging để tách. Lưu ý: Đối với bản Vndocr demo, chỉ nhận dạng được tối đa 3 file ảnh 1 lần. Bước 2: Khởi động Vndocr, vào “Đọc ảnh”, chọn file bạn cần. ![]() Bước 3:Hiệu chỉnh ảnh để cho kết quả tốt nhất. Gợi ý các thao tác sau: 1. Xoay ảnh: Khi văn bản chụp ở vị trí không phải thẳng đứng, bạn cần xoay lại trước khi nhận dạng. 2. Chỉnh độ nghiêng: cần dùng nếu phần văn bản không được ngay ngắn khi scan hoặc chụp. 3. Xóa nhiễu: Khi scan hoặc chụp các tài liệu cũ sẽ có những vết đen, thao tác này giúp làm “sạch” trước khi nhận dạng. ![]() 4. Làm dày hoặc mỏng bớt nét chữ: giúp tăng hiệu quả nhận dạng. Thông thường ta chỉ cần dùng chế độ “Làm dày nét”. Có thể tăng hoặc giảm nhiều lần. Trước khi làm dày nét: ![]() Sau khi làm dày nét: ![]() Lưu ý: Với file ảnh có chất lượng tốt, chỉ cần dùng chức năng “làm dày nét chữ” là đạt. Bước 4:Tiến hành nhận dạng 1. Chọn nút “Phân vùng” để máy tự động chọn vùng cần nhận dạng, hoặc dùng chuột để phân vùng theo ý muốn. Thông thường chọn toàn bộ phần văn bản của 1 trang. Nếu trang cần nhận dạng có 2 cột (hoặc 2 trang sách trên 1 trang ảnh), bạn chọn thành 2 vùng riêng biệt (Xem ảnh) ![]() 2. Chọn nút “Nhận dạng”: phần hiện ra bên phải màn hình là nội dung đã được “số hóa” từ file ảnh (.tif) của bạn. ![]() Bước 5: Chỉnh sửa chính tả: Theo kinh nghiệm, các bạn nên sửa chính tả các phần vừa nhận dạng ngay trên Vndocr vì rất dễ đối chiếu với phần văn bản gốc. Bước 6: Sao chép văn bản sang Word – dàn trang: - Bản Demo Vndocr không cho copy. Tuy nhiên, các bạn có thể dùng thủ thuật “kéo – thả” để chuyển sang word. - Các bạn chỉ nên thực hiện việc format, cân chỉnh phần văn bản bên Word một lần, sau khi đã hoàn tất nhận dạng, chỉnh sửa chính tả và copy sang Word toàn bộ nội dung cần thiết. ![]() Văn bản sau khi copy sang Word - Sử dụng Find and Replace cho toàn bộ văn bản trong Word: (chỉ gõ phần trong dấu “ ”). Ghi chú: ^p chính là dấu xuống dòng "enter" a. Thay “.^p" (dấu . và dấu ^ và chữ P) bằng …. (4 dấu chấm) b. Làm tương tự với “?^p” bằng "???"; “!^p” bằng "!!!"; ":^p" bằng ":::" c. Thay “^p” (dấu ^ và chữ p) bằng “” (1 khoảng trắng) d. Thay "" (2 khoảng trắng) bằng "" (1 khoảng trắng) e. Thay " ." (1 trắng và dấu chấm) bằng "." (1 dấu chấm) f. Thay " ," (1 trắng và dấu phẩy) bằng "," (1 dấu phẩy) g. Thay ", " (dấu phẩy và 2 khoảng trắng bằng ", " (dấu phẩy và 1 khoảng trắng h. Thay ngược lại “….” (4 dấu chấm) bằng “.^p”; “!!!” bằng “!^p”; “???” bằng “?^p”; ":::" bằng ":^p) Giải thích: Khá khó hiểu nếu bạn lần đầu làm, tuy nhiên, sẽ rất hữu ích, nếu chưa hiểu nhưng các bạn áp dụng chính xác các bước trên .- Các bước màu đen: sửa chữa lỗi “dư khoảng trắng” khi nhận diện. - Các bước màu đỏ: văn bản sau khi nhận dạng giữ nguyên định dạng của sách về bố cục, bị xuống dòng tại những nơi không phù hợp (chưa hết câu). Thay “^p” bằng “ ”, tức là thay “lệnh enter” bằng 1 dấu cách: văn bản sẽ liên tục, không bị xuống dòng khi chưa hết câu nữa. - Các bước màu xanh a, b: Khi làm như trên, định dạng xuống dòng giữa các paragraph và các câu đối thoại sẽ mất hết. Việc thay “.^p”, “!^p”, ?^p” thành “….”, “!!!”, “???” trước khi tiến hành bước c là để “đánh dấu” các chỗ cần xuống dòng. Sau khi xong hết các bước a,b…f,g, ta làm bước h để trở lại trạng thái ban đầu: [(Dấu chấm + enter), (dấu hỏi + enter), (dấu chấm than + enter) là dấu hiệu thông thường khi có xuống dòng giữa các paragraph, hoặc giữa các câu đối thoại.] Ghi chú: Việc dàn trang, sửa chữa lỗi định dạng theo hướng dẫn trên chỉ nên dành cho các bạn có văn bản gốc để đối chiếu và tương đối rành rẽ việc sử dụng Vndocr. ![]() Văn bản sau khi dùng chức năng “Find and replace” (phần bôi đen) Bước 7: Kiểm tra chính tả (chỉ phân công sau khi đã dàn trang, xử lý các lỗi về định dạng ở bước 6). Bước 8: Đóng gói thành ebook .prc và đưa ebook lên Box phù hợp. Thông báo hoàn tất dự án. III. Đánh máy trực tuyến thông qua chương trình hỗ trợ Google docs: Các bạn xem chi tiết tại đây. thay đổi nội dung bởi: Becon53, 12-04-2009 lúc 10:05 PM Lý do: Bổ sung thông tin. |
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
|
|
#4 |
|
Thủ thư
|
V. PHƯƠNG PHÁP NHẬN DIỆN KÝ TỰ TIẾNG VIỆT TỪ FILE ẢNH (ONLINE)
Sau đây là một vài trang cung cấp dịch vụ nhận diện ký tự (như phần mềm VNdocr nói ở mục III) từ file ảnh: 1. http://www.newocr.com/ 2. http://www.free-ocr.com/ (và nhiều địa chỉ khác có thể tìm được trên Google) Dịch vụ trực tuyến miễn phí này sẽ giúp bạn chuyển văn bản tiếng Việt trong một file ảnh thành file doc hay text một cách chính xác hơn nhờ hỗ trợ nhiều ngôn ngữ khác nhau, trong đó có tiếng Việt. Điểm tiện lợi của công cụ này là làm việc được với nhiều định dạng ảnh khác nhau như jpeg, png, gif, bmp and tiff và file pdf. Vẫn còn một chút hạn chế đối với các file ảnh: dung lượng cho mỗi file không được quá 1 MB, nhưng file pdf thì có thể lên đến 10 MB. Các bước thực hiện đơn giản như sau: - Chọn file ảnh cần nhận diện. - Chọn ngôn ngữ (chọn giống với ngôn ngữ trên file ảnh) - Xoay ảnh (nếu cần) - Chọn "Send file" để tiến hành nhận diện. Kết quả sẽ có chỉ sau một khoảng thời gian ngắn. Chú ý ở khung bên phải phía dưới dòng GET FILE sẽ là 2 biểu tượng của định dạng doc (trang văn bản có hình) và txt (trang văn bản không hình), bạn lựa chọn định dạng phù hợp và bấm vào đó để tải về (đối với làm ebook , các bạn có thể copy nội dung đã nhận diện vào chung 1 file word ngay khi nhận diện, không nên lưu mỗi trang thành 1 file riêng biệt) Để tiếp tục với các file khác, bạn chọn Upload New File và thực hiện các bước tương tự như trên. Ưu điểm của phương pháp này là không cần cài đặt phần mềm, đơn giản dễ sử dụng. Việc copy nội dung sang word cũng đơn giản hơn khi dùng Vndocr (bản demo). Và đặc biệt là sử dụng được với hầu hết định dạnh ảnh, kể cả pdf. Tuy nhiên phương pháp này không cung cấp các tiện ích như: làm dày/mỏng nét, xoá nhiễu, chỉnh độ nghiêng,... cho nên các bạn lưu ý điều chỉnh file ảnh đạt chất lượng trước khi đưa vào nhận diện để cho kết quả tốt nhất. Becon53 đã thử nghiệm trên trang www.neworc.com và thấy đạt kết quả tốt. Tuy nhiên rất cần những thử nghiệm khác của các bạn để có những thông tin bổ sung giới thiệu đến mọi người. Thân ái. Bổ sung thông tin: Với các ảnh chụp thông thường .jpg, các bạn có thể resize về 25% vẫn cho chất lượng nhận diện tốt. P.S.: Cảm ơn bạn hainguyenspk đã cung cấp thông tin này .
thay đổi nội dung bởi: Becon53, 10-01-2010 lúc 10:20 AM Lý do: Cập nhật. |
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
|
|
#5 |
|
Học sinh
Tham gia ngày: Jun 2008
Bài gởi: 55
Xin cảm ơn: 155
Được cảm ơn 698 lần trong 22 bài
|
Xin becon53 giúp mình hiểu thêm về cách nhận dạng ảnh.
- Mình đã vào trang web newocr.com và làm như bạn hướng dẫn, nhưng nó chỉ hiện ra 1 hình tương tự như ảnh mình đã chụp, copy vào word thì vẫn là 1 picture. - Khi sử dụng phần mềm Vndocr, bấm vào nút Nhận dạng, hệ thống luôn báo chỉ làm việc với ảnh đen/trắng. Bạn có thể hướng dẫn mình cách chuyển ảnh màu sang ảnh đen trắng được không? - Mình không tìm thấy kiểu chụp Black and White trong máy ảnh (Mình đang dùng Sony Cybershot W175) nên khi chụp, ảnh nhận được luôn là ảnh màu, vì vậy, không dùng Vndocr được. Rất mong nhận được thông tin từ bạn. Xin cảm ơn! thay đổi nội dung bởi: nth34hn, 09-01-2010 lúc 11:21 AM |
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
|
|
#6 | |
|
Thủ thư
|
Trích:
2. Để sử dụng được Vndocr, bạn cần lưu ý mấy điểm sau: - Phải là file định dạng .tif đen trắng, độ phân giải khoảng 200-300 dpi (dung lượng ảnh từ 15-70kb cho kết quả nhận diện tốt nhất). Nếu là ảnh đuôi .jpg hoặc .pdf thì bạn phải dùng phần mềm chuyển đổi định dạng (convert), phần này có lẽ bạn phải tự tham khảo thêm vì hướng dẫn qua Thư viện không khả thi lắm. BQL sẽ nghiên cứu giới thiệu khi có bài viết hoàn chỉnh. - Khi convert ảnh sang .tif, bạn phải chọn chế độ ảnh đen trắng. Nhìn chung, becon53 khuyên bạn dùng newocr vì cách dùng đơn giản, đặc biệt thích hợp khi dùng ảnh chụp (.jpg). Chúc bạn thành công. |
|
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
|
|
#7 |
|
Học sinh
Tham gia ngày: Jun 2008
Bài gởi: 55
Xin cảm ơn: 155
Được cảm ơn 698 lần trong 22 bài
|
|
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
sieuhangdv (01-09-2010)
|
|
|
#8 |
|
Học sinh
Tham gia ngày: Oct 2009
Bài gởi: 61
Xin cảm ơn: 669
Được cảm ơn 50 lần trong 39 bài
|
xin chào becon53, mình có một thắc mắc xin nhờ bạn giải đáp giùm.
Mình đang tạo 1 ebook. Mặc dù đã canh chỉnh trong file word nhưng khi chuyển sang file .prc thì khoảng cách giữa các hàng không như mình đã định dạng.Trong file word, minh canh chỉnh spacing: 1.5 lines cho toàn bộ văn bản. Nhưng khi chuyển sang file prc thì toàn bộ văn bản mỗi dòng không cách ra mà dính lại như mình tạo văn bản thô vậy. Xin chỉ mình cách tạo khoảng cách giữa các dòng trong file prc. Mong nhận được hồi âm sớm của bạn. MTU |
|
|
|
|
|
#9 |
|
Mọt sách
Tham gia ngày: Dec 2009
Nơi Cư Ngụ: U u cốc
Bài gởi: 197
Xin cảm ơn: 68
Được cảm ơn 6,405 lần trong 178 bài
|
Mình có một việc muốn nhờ bạn Becon53 hướng dẫn giúp. Đó là trong khi tạo ebook mình muốn ảnh bìa của cuốn truyện hiện lên lúc mà mở chương trình mobipocket reader thì phải làm thế nào? (Nghĩa là khi mở chương trình đọc ebook nó không hiện chữ book mà hiện ảnh bìa của cuốn truyện ý). Vì hầu như truyện mình down về đọc cũng chỉ có một số quyển hiện được như thế chứ đa phần chỉ có tên truyện thôi ( như cuốn some one over to watch me ý). Mình cũng thử vào phần cover imagine lúc tạo ebook nhưng vẫn không đưược). Rất mong nhận được sự giúp đỡ của bạn cũng như các bạn am hiểu việc tạo ebook.
thay đổi nội dung bởi: memory882004, 08-05-2010 lúc 01:11 PM |
|
|
|
|
|
#10 | |
|
Thủ thư
|
Trích:
|
|
|
|
|
| Các thành viên gửi lời cảm ơn đến bài viết hữu ích này: |
D&D (18-06-2012), sieuhangdv (01-09-2010)
|
![]() |
| Bookmarks |
| Ðiều Chỉnh | |
| Xếp Bài | |
|
|