Bài viết khá dài bao gồm các phần như dưới đây:
I. Giới thiệu
II. CÁCH CHÉP DỮ LIỆU TỪ ĐIỂN VÀ PHÁT ÂM
III. Sử dụng và thiết đặt cơ bản
IV. Phiên bản miễn phí iStardict
V. Link tải dữ liệu từ điển và phát âm tiếng Anh
VI. Nói thêm về quản lý dữ liệu phát âm
VII. Special Topic: Convert dữ liệu từ điển Babylon (BGL), Lingvo (dsl), wiki sang stardict format
I. Giới thiệu
GuruDic là một ứng dụng cho iPhone/iPod Touch nhằm đọc dữ liệu các từ điển dạng stardict.
GuruDic do 1 tác giả người Hàn Quốc (anh Kyun Sang Song) viết để học tiếng Việt.
Sau nhiều lần update tính năng, GuruDic đã càng trở nên hoàn thiện hơn.
Nói đơn giản: Gurudic/iStardict biến iPhone/iPodTouch của bạn thành Kim từ điển, thậm chí còn hơn thế - với rất nhiều từ điển được share bởi mọi người
GuruDic đã thành ứng dụng Universal, chạy trên cả iPhone và iPad
Các chức năng chính:
- Hỗ trợ đa định dạng của từ điển stardict: – m(Plain Text)、 h(HTML)、 g(Pango Markup)、 x(XDXF)
- Tra nhiều từ điển cùng lúc
- Hỗ trợ từ đồng nghĩa và ghép từ đồng âm dị nghĩa
- Lịch sử và Sổ từ để lưu các từ đã tra
- Hỗ trợ phát âm tiếng Anh (file mp3, wav) (tải dữ liệu phát âm tương tự dữ liệu từ điển)
- Tra chéo (tính năng jump)
- Xoay và khoá xoay màn hình
- Hỗ trợ Fast App Switching (iOS4)
- Tự động tra cứu nội dung clipboard
- Liên kết với các ứng dụng hỗ trợ URL Schema (iDaily Pro/Lite, VOA Standard English, iBunko...)
- Chuyển dữ liệu từ điển vào GuruDic qua iTunes File Sharing, tải trực tiếp từ URL hoặc từ máy tính qua wifi.
Thông tin thêm, tham khảo: http://gurudic.tistory.com/
Bạn có thể tìm và tải về từ AppStore:
AppStore GuruDic 0.99$ http://itunes.apple.com/us/app/gurudic/id366192217?mt=8
(Link ngắn gọn: appstore.com/gurudic)
Phiên bản cập nhật 1.3 (2013/02/04, yêu cầu iOS 4.3 trở lên) đã có trên AppStore
- Hỗ trợ iPhone 5, iPad retina
- Thêm tính năng backup dữ liệu từ điển
- Cải tiến giao diện & tiện dụng hơn:
+ Double tap để chuyển sang FullScreen trên iPhone
+ Khi bấm quay lại tab Tìm kiếm: ô nhập liệu tự động chọn txt, không cần xoá thủ công từ tra trước đó
+ Danh sách kết quả tự ẩn (iPad)
- Tự tạo file ifo cho data từ điển không có file ifo
- Phát âm cả ở Silent mode, không dừng nhạc mở background.
Tóm tắt các bước để cài đặt và sử dụng GuruDic:
(dành cho các bạn mới dùng)
1. Cài đặt GuruDic: mua trên AppStore hoặc tìm file ipa ở đâu đó - nếu bạn không mua được.
2. Trên máy tính cần có iTunes. Tải về công cụ iTools hoặc iFunbox hỗ trợ chuyển file trực tiếp vào iPhone.
3. Tải về data từ điển từ dưới đây, chép vào iDevice theo một trong các cách dưới đây.
4. Chép xong từ điển thì trên iPhone bật GuruDic lên và vào tab từ điển để xem và bật các từ điển lên.
II. CÁCH CHÉP DỮ LIỆU TỪ ĐIỂN VÀ PHÁT ÂM
(Cập nhật 22/08/2012)
CHÚ Ý:
Với iOS 5.1 trở lên, bạn cần chép data vào thư mục Documents của GuruDic
UPDATE 02012012: cách đơn giản nhất là sử dụng iTools để copy dữ liệu - máy chưa jailbreak cũng làm đơn giản.
(Bài viết về iTools: Link)
Với iOS4 trở về trước: Copy trực tiếp data từ máy tính vào thư mục /Library/Caches/Dictionary của GuruDic. Thư mục được copy vào được set quyền là mobile luôn nên các bước GuruDic tự tạo file đệm để truy cập nhanh đều OK.
Tham khảo hình sau:
Sau khi chép dữ liệu xong, bật GuruDic lên vào tab Dictionaries rồi chọn các từ điển muốn dùng.
Từ điển được chọn và tạo bộ đệm sẽ chuyển màu xanh da trời.
Ngoài ra còn có các cách dưới đây:
Cách 1: Copy dữ liệu từ điển thông qua iTunes Files sharing (GuruDic 1.1 trở đi, dùng cho tất cả các máy iOS4)
1. Chuẩn bị file zip từ điển: Bạn tải dữ liệu từ điển về (file .zip or .tar.bz2)
(các file của cùng từ điển cho vào gốc file zip - không nằm trong folder nào)
2. Kéo thả file zip trên vào ô iTunes Files sharing của GuruDic trong tab Apps của iTunes.
3. Trên iPhone: GuruDic - chuyển đến
• Cài đặt
• Cài đặt từ điển
• Chọn Browse Từ điển, bạn sẽ thấy file zip ở trên, chọn file đó.
4. Bấm "Bắt đầu cài đặt" rồi chờ một lát, từ điển sẽ được copy vào GuruDic.
5. Khởi động lại GuruDic. Xong
File zip sẽ được xoá tự động.
Tham khảo hình ảnh sau:
Cách 2: Tải qua direct URL link (cần kết nối Internet, tất cả các máy và iOS)
Nếu có direct link của nguồn dữ liệu từ điển (dạng file .zip or .tar.bz2), bạn có thể làm như sau:
- Copy link rồi dán vào ô địa chỉ ở mục “Cài đặt từ điển”.
- Sau đó bấm “Bắt đầu cài đặt”.
- Chờ một lát dữ liệu sẽ được tải về và cài đặt vào GuruDic.
Cách 3 (copy trực tiếp) - Yêu cầu: Máy đã jailbreak
Bạn có thể dùng một trong các công cụ sau để chuyển dữ liệu từ điển
- iFunbox
- iPhone Browser
- ….
Bản mới nhất của iFunbox: http://www.i-funbox.com/
1. Dữ liệu từ điển dạng stardict bao gồm 3 files *.ifo for information, *.idx or .*idx.gz for index, *.dict or *.dict.dz for word description data (nếu có media thì thêm thư mục res nữa).
Bạn gom các file thuộc một từ điển vào cùng một thư mục. Nếu tải các file từ điển dạng zip về thì giải nén ra một thư mục.
2. Copy thư mục từ điển trên vào vào iPhone/iPad, nơi chép dữ liệu cho GuruDic:
//var/mobile/Applications/E3A65751-5C06-4518-8421-C641C9FB4FC5/Library/Caches/Dictionary
(phần địa chỉ bôi đậm trên máy bạn sẽ khác, nếu thư mục Dictionary chưa có thì bạn cần tạo nó)
=> Cập nhật iFunbox phiên bản mới nhất v1.0.381.331 sẽ tìm tên thư mục dễ hơn, dựa theo tên App.
3. Khởi động lại GuruDic.
Với cách 3 này, bạn cần set permission cho thư mục từ điển là 775 hoặc 755 (có thể dùng iFile hoặc WinSCP… để thực hiện việc này). Mục đích là để GuruDic tạo file đệm cho từ điển để truy cập nhanh hơn. => Xem phần dành cho iStardict dưới đây.
==================
Chú ý: VỀ CÀI ĐẶT PHÁT ÂM
Một số bạn bị lỗi không cài được phát âm thì chú ý xem lại dữ liệu của mình, ví dụ tên thư mục là chữ in HOA A-Z => cần đổi thành a-z...
- Bước 1: Chép dữ liệu phát âm (file mp3, wav) bạn cũng làm như trên như với dữ liệu từ điển.
- Bước 2: Để phần phát âm hiện thị khi tra từ: Sau khi chép dữ liệu, bạn vào Settings - Pronunciation Settings để cài đặt dữ liệu phát âm. (Xem thêm phần VI dưới đây)
III. Sử dụng và thiết đặt cơ bản
Chức năng cơ bản tra cứu thì chắc bạn biết dùng ngay
Hơn nữa nếu iOS của bạn là tiếng Việt, giao diện GuruDic cũng là tiếng Việt nên rất dễ sử dụng.
1. GIAO DIỆN CƠ BẢN GuruDic
Để tra cứu một từ nào đó, bạn nhấn tab "Search" rồi nhập từ cần tra, GuruDic sẽ tìm kiếm và cho ra một danh sách các kết quả từ các từ điển đã được cài đặt. Bạn tap vào từ điển nào đó để xem nghĩa.
2. CÁC CÀI ĐẶT CƠ BẢN
3. Một số thủ thuật sử dụng
- GuruDic hỗ trợ tự động tra cứu clipboard (v1.2 trở đi), từ ứng dụng khác bạn copy text, chuyển qua GuruDic là bạn có ngay kết quả.
- GuruDic hỗ trợ URL Schema "gurudic:%@" giúp bạn liên kết với các ứng dụng hỗ trợ (iDaily, VOA Standard English Player, iBunko...)
- Tra cứu từ ứng dụng khác với ActionMenu Addon cho GuruDic (tham khảo thêmhttp://www.tinhte.vn/phan-mem-165/action-menu-cac-add-tra-cuu-tien-loi-gurudic-ldoce-wedict-524617/ )
Bạn chỉ cần bôi chọn text, chọn Gurudic trong pop up menu, kết quả được tìm ra ngay
+ Yêu cầu Gurudic 1.2 trở lên
+ Cài đặt ActionMenu từ Cydia (free)
+ Cài đặt ActionMenu Addon for Gurudic từ Cydia hoặc file deb sau: http://www.mediafire.com/?90d6a9i6a0gx1ad (pass: gurudic)
Bạn có thể tìm ActionMenu Daijirin trên Cydia, cũng hỗ trợ GuruDic (cùng nhiều từ điển khác).
- Respring và enjoy
- Kết hợp Action Menu addon, LastApp, Activator + multitasking giúp việc tra cứu từ khi đọc tài liệu/web trở nên tiện lợi hơn bao giờ hết
LastApp là một tweak Cydia giúp gán gesture của Activator để quay lại app trước đó.
IV. Phiên bản miễn phí iStardict
Tiền thân của GuruDic là iStardict, miễn phí cả trên Cydia và AppStore.
Các tính năng cơ bản đều tốt cả. Tuy nhiên iStardict đã không còn được phát triển tiếp.
Anh em không mua được từ AppStore có thể thử phiên bản iStardict 1.3.5 từ file deb sau:
http://www.mediafire.com/?3mc4n65og47k8o6
Về chép dữ liệu từ điển & phát âm cho cho iStardict:
NOTE: iFunbox phiên bản 1.7 trở lên hỗ trợ truy cập thư mục app ngay cả với máy chưa jailbreak. Mời anh em dùng
Cách 1: Tải từ điển qua file .zip hoặc .tar.bz2: (tương tự cách chép & cài qua iTunes File Sharing của GuruDic).
Bằng cách này, iStardict sẽ tự set permission cho các từ điển cài vào.
Bước 1: Dùng iFunbox tạo thư mục //var/mobile/Media/DCIM/Dictionary
Bước 2: Chép file từ điển dạng .zip hoặc .tar.bz2 (để nguyên, không giải nén) vào//var/mobile/Media/DCIM/Dictionary
Bước 3: Trên iPhone, mở iStardict tìm đến Settings - Dictionary Install
- Bấm Browse Dictionary; bạn sẽ tìm thấy file .zip hoặc .tar.bz2 đã copy ở trên =>
- Chọn file đó
- Quay lại và bấm Start Install
Chờ một lát cho từ điển được giải nén và cài vào iPhone
Xong
Cách 2: Tải qua direct URL link (cần kết nối Internet, tất cả các máy và iOS)
Xem cách 2 dành cho GuruDic ở trên.
Cách 3: Copy trực tiếp (như Cách 3 cho GuruDic ở trên).
Tuy nhiên địa chỉ copy dữ liệu có khác.
- Dùng iFunbox, iPhone Folders... kết nối với iPhone, tạo thư mục /var/mobile/Library/Dictionary nếu chưa có.
- Chép dữ liệu từ điển vào thư mục đó.
Cách set permission để từ điển load nhanh hơn, sau khi đã chép dữ liệu từ điển vào /var/mobile/Library/Dictionary
(Chỉ cần làm với cách 3 - copy dữ liệu trực tiếp qua iFunbox)
Có lẽ dễ nhất là bạn dùng iFile (chạy trên iPhone).
iFile là chương trình duyệt file trên iOS và có chức năng set properies (bao gồm permission của thư mục hoặc file).
iFile là phần mềm mất phí, mình thì mua đàng hoàng. Nhưng nếu bạn không mua được thì có thể add repo http://cydia.xsellize.com rồi tìm iFile và cài đặt.
CẬP NHẬT: iFunbox từ phiên bản 1.6 đã hỗ trợ set permission.
Sau đó mở iFile ra tìm đến thư mục đã copy từ điển trong //var/mobile/Library/Dictionary rồi set properties cho từng thư mục từ điển.
- Bạn bấm vào mũi tên màu xanh bên cạnh tên thư mục nó sẽ mở ra chỗ để set properties như hình sau:
Xong thì khởi chạy iStardict, lần này vẫn hơi lâu một chút. Sau đó, trong thư mục từng từ điển có các file đuôi .oftz; .oft là OK.
Cần thì respring hoặc Reboot iPhone, rồi chạy iStardict.
Từ giờ trở đi, tốc độ load iStardict sẽ nhanh lên đáng kể.
------------------
Sử dụng iStardict tương tự GuruDic (xem ở trên) (trừ các tính năng mới cập nhật: multi-tasking, tự tra cứu clipboard, url schema, actionmenu addon...).
V. Link tải dữ liệu từ điển và phát âm tiếng Anh
Mời anh em tìm data ở link sau:
LINK FOLDER CÓ TẤT CẢ DATA TỪ ĐIỂN: DATA
Pass nếu cần là gurudic
Ghi chú:
- Tìm ở LINK FOLDER DATA TỪ ĐIỂN trên trước khi hỏi.
- Do một số vấn đề bản quyền nên nhiều link từ điển không được post lên đây.
==============================================================
Từ điển Việt Việt (dữ liệu gốc: Hồ Ngọc Đức)
Số từ: 29662
Từ đồng nghĩa (syn): 30664
File Viet-Viet.zip (2.1MB) http://www.mediafire.com/?v1i2ud24zflect4
Converted by dangquybk
------------------
Wikipedia tiếng Việt 28-03-2012
Bản cập nhật ngày 28-03-2012 by dangquybk.
Data này cũng có thể dùng cho Stardict, Goldendict...
StarDict's dict ifo fileversion=2.4.2
wordcount=467652
idxfilesize=12791113
stripmethod=keep
sametypesequence=h
bookname=WikiViet(2012.03.28)
Data gồm hai phần:
Part 1
Part 2
Ghép lại bằng File Splitter Joiner hoặc 7-zip
Chú ý
Các mục bắt đầu bằng [ă, â, ơ, ư, đ, ê, ô] tra cứu được nhưng cần bấm Uppercase.
Chẳng hạn "đồng nai" => Not Found; "Đồng Nai" => OK
-------------------
En-En-Wiktionary, dữ liệu tháng 1/2012
Cảm ơn bạn tienlbhoc
Code:
- Chuyển từ tab thành babylon với tab2bgl
- Chuyển link thành dạng của Babylon: Dùng EMEditor find & replace: a href="entry:// => a href="bword://
- Dùng RawURLFix để sửa các link chứa dấu cách
- Build bằng Stardict Editor :-)
Code:
wordcount=408019
idxfilesize=7895766
bookname=En-En-Wiktionary
author=dangquybk & tienlbhoc
description= Từ điển mở En-En Wiktionary.
sametypesequence=h
Link: En-En-Wiktionary 43MB
TIẾNG ANH:
All in one: Anh-Anh (Longman), Việt-Việt, Anh-Việt-Anh (Lạc Việt) mtBab-EVE.zip 73MB
Anh Việt, Việt Anh
EV(bản đẹp)
VE(bản đẹp)
Từ điển chuyên ngành kỹ thuật, kinh tế (Technical, Business EV-VE, gốc Prodic)
Bộ Prodic (Kỹ Thuật - Kinh tế, Anh <> Việt) do mình mới convert lại, không thay đổi dữ liệu gốc, chỉ dùng dictzip nén lại. Giao diện đẹp như trên PC
Bản 4-in-1 Prodict_4in1_all.zip 39MB
Từ điển dầu khí:
Bản mới: Oil_Gas_Dict_v3
Bản cũ: Oil_Gas_Dict_V2.01
Grammar in use
Gốc từ dữ liệu babylon của Bùi Quốc Phong
wordcount=273
synwordcount=404
description=Dữ liệu bao gồm 136 bài của cuốn ngữ pháp nối tiếng "Grammar in use". nhập các từ khóa về bài học bạn mong muốn. Nhập "zzzz" hoặc "grammar in use" hoặc "griu" hoặc "ngu phap" hoặc "ngữ pháp" để vào danh sách bài học
Link: Grammar_in_use_new_version.zip 4.5MB
(đừng quên copy thư mục res nhé, vì từ điển này lấy nhiều hình ảnh để hiển thị chứ không phải text hoàn toàn)
WORDNET
WordNet3_1.1.zip 22MB
Computer_Dictionary
http://www.mediafire.com/file/9p7ul...ylon-FOLDOC_Computer_Dictionary-2.4.2.tar.bz2
DATA PHÁT ÂM TIẾNG ANH
Longman English voice
Longman American voice
Webster English voice
Tìm trong folder mediafire ở trên, google hoặc PM for link
TIẾNG NHẬT (cực kỳ đồ sộ, đừng ngất nhé!)
ALL IN ONE: Nhật-Nhật (Daijirin), Nhật-Việt-Nhật (Javidic), Anh-Nhật-Anh (Genius, Kenkyusha, JEJ) Big_Dictionary_JEV.zip 114MB
ALL IN ONE-KANJI Big_Kanji_Dic.zip 22MB
JaviDic Nhật Việt, Việt Nhật đã mở thành tratu.com nên hình như k sao về bản quyền
http://www.mediafire.com/?6usayb1sar3s797
http://www.mediafire.com/?ggg26j6igd6d9mt
Nhật Anh Nhật (gốc Babylon) http://www.mediafire.com/?a29tyiv3zarnv5h
myDictionary1,2,3,4 Hán Việt, Nhật Việt, Nhật Hán Việt, Tên Nhật (Gốc Babylon- Dang Kien Thanh)
http://www.mediafire.com/?rybn2986orr4h31
http://www.mediafire.com/?ya5hayr0v5nz39u
http://www.mediafire.com/?4b85ecl9hdod7vl
http://www.mediafire.com/?44oe18oib3070cc
Kanji, chữ Hán
Kanji Tiếng Việt (có âm On, Kun); Từ điển Hán Việt Thiều Chửu; Hán Việt (Bùi Quốc Phong): có thể tra một số cụm từ Việt sang Hán, giải thích đầy đủ.
http://www.mediafire.com/?yunc1jz38axeae6
Hán Việt: phiên bản đặc biết hỗ trợ tra từ chữ Hán và ngược lại từ âm Hán Việt, built by dangquybk
http://www.mediafire.com/?ocqhdq6b113hppe
Ngữ pháp 1-2kyuu (data do chính dangquybk biên soạn, mới cập nhật)
173 cấu trúc ngữ pháp 2kyuu http://www.mediafire.com/?dm3h6dfi5bkr65u
Cách dùng:
Gõ index_2kyuu hoặc mucluc_2kyuu hoặc 2kyuu_all để hiện danh mục.
Hoặc gõ từ khoá cấu trúc ngữ pháp để tìm kiếm.
Gõ 2kyuu sẽ ra kết quả tổng hợp 173 cấu trúc ngữ pháp.
99 cấu trúc ngữ pháp 1kyuu http://www.mediafire.com/?waeyg6k3amch1aj
Cách dùng:
Gõ index_1kyuu hoặc mucluc_1kyuu hoặc 1kyuu_all để hiện danh mục.
Hoặc gõ từ khoá cấu trúc ngữ pháp để tìm kiếm.
Gõ 1kyuu sẽ ra kết quả tổng hợp 99 cấu trúc ngữ pháp.
TIẾNG PHÁP
mtBab_FV VF (gốc Lạc Việt)
FV
VF
French_Morphology_and_Phonetics Link
Pass: gurudic
Larousse_multidico
Link
Pass: gurudic
TIẾNG HÀN
Korean Dict, Eng-Korean
Và nhiều nữa:
EngKorDictionary.zip
Korean_Vietnamese.zip
star_viethan.zip
stardict-Hanja_KoreanHanzi_Dic-2.4.2.tar.bz2
stardict-KoreanDic-2.4.2.zip
stardict-KoreanEnglishDic-2.4.2.tar.bz2
stardict-quick_eng-kor-2.4.2.zip
STD_Korean_Dictionary.zip
국어사전.zip
TIẾNG Ý
Babylon Anh Ý, Ý Anh
TIẾNG TRUNG rất nhiều ở đây http://www.mediafire.com/?dkm9b2m4k94yk
advanced chinese dictionary (ch-ch).zip
cedict (22.01.2012).zip
hanyu da cidian v3.0 simp (ch-ch).zip
hanyu da cidian v3.0 trad (ch-ch).zip
HYDCD_2.0.zip
langdao english-chinese dictionary.zip
mtBabCV(S).zip
mtBabCV(T).zip
mtBabVC(S).zip
mtBabVC(T).zip
mtBab CV, VC (Giản thể) - dữ liệu gốc: Từ điển Lạc Việt tiếng Trung (Giản thể):
CV
VC
Bản phồn thể: CV VC
Từ điển Babylon English <> Chinese (Giản thể và Phồn thể) Hình như cái này free
TIẾNG THÁI
AbbrevThTh-2.4.2.zip
LEXITRON Thai sounds.zip
LexitronEnTh-2.4.2.zip
LexitronThEn-2.4.2.zip
RoyalInstituteThTh-2.4.2.zip
SEASite.zip
SEASiteThEn-2.4.2.zip
VI. Nói thêm về quản lý dữ liệu phát âm
Cấu trúc thư mục:/Dictionary/Longman_American(chẳng han)/0-9, a, b, c...
Tức là các thư mục có đầu chữ cái và 0~9 nằm ngay trong thư mục dữ liệu phát âm 'Longman_American'; thư mục này lại nằm ngay dưới 'Dictionary'
Nếu cấu trúc thư mục khác đi thì bạn sẽ không add được. Tên các thư mục phải là chữ cái thường, KHÔNG PHẢI CHỮ IN HOA.
Settings:
Chọn Settings - Pronunciation Settings - Ấn nút + để thêm data, rồi chọn vài bước
Một số hình ảnh tham khảo khác
Tra từ với phát âm tiếng Anh/Mỹ - Quản lý và sắp xếp từ điển - Word book học ôn từ mới - Settings
=========================================
VII. Special Topic: Convert dữ liệu từ điển Babylon (BGL), Lingvo (dsl), wiki sang stardict format
A. Cách convert bgl => stardict (dict, idx, ifo) như sau:
Cách 1:
Step 1: Dùng Stardict Editor (Chọn kiểu file nguồn là BGL): .bgl => .babylon
File text; cấu trúc cơ bản của nó là dạng này
======
apple|apples
the meaning of apple
2dimensional|2dimensionale|2dimensionaler|2dimensionales|2dimensionalem|2dimensionalen
two dimensional's meaning
the sencond line.
======
Step 2: Cái cần chỉnh sửa là đây. File .babylon này đôi khi chứa các dữ liệu lằng nhằng: html, css, java... (gốc gác từ file bgl kia)
=> Gọt bớt được đi thì data sẽ nhẹ nhàng, load trên iPhone cũng dễ.
Step 3: Dùng tiếp Stardict Editor (Kiểu file nguồn Babylon) chuyển .babylon => stardict
Cách 2: Kết hợp UnpackBGL và Stardict Editor khi một mình Stardict Editor không cho kết quả mong muốn (sai mã, không tách được hết dữ liệu,... )
Step 1: Dùng UnpackBGL: .bgl =>.txt (thực chất là giống .babylon ở Cách 1).
Step 2: Xử lý file .txt này: Convert mã, xoá bớt html, css...
Step 3: Dùng Stardict Editor (chọn kiểu file nguồn là Babylon): .txt => stardict
Hiện tại các file .babylon mình chỉ xử lý được một số chỗ về mã tiếng Việt, do đó output file khá to
Được cái là hiển thị được thì sẽ y nguyên như trên Babylon của PC.
=> Chung cho cả hai cách: NÉN DỮ LIỆU sau khi convert.
Dùng công cụ dictzip để chuyển file .dict thành .dict.dz; file size có thể giảm đến cả chục lần.
Đây lại là một điểm mạnh của iStardict/GuruDic so với Wedict, vì Wedict không hỗ trợ sử dụng file nén dạng .dict.dz mà chỉ hỗ trợ dạng .dict
Trích http://code.google.com/p/babiloo/wiki/StarDict_format
You can use dictzip to compress the .dict file.
"dictzip" uses the same compression algorithm and file format as does gzip,
but provides a table that can be used to randomly access compressed blocks
in the file. The use of 50-64kB blocks for compression typically degrades
compression by less than 10%, while maintaining acceptable random access
capabilities for all data in the file.
... Stardict will search for the .ifo file, then open the .idx or
.idx.gz file and the .dict.dz or .dict file which is in the same directory and
has the same base name.
Tools
UnpackBGL
Stardict Editor
VietCNV (Convert TV bảng mã bất kỳ về UTF-8 - Credit: Tác giả GuruDic)
dictzip
Các công cụ khác: EmEditor, UltraEditor, Notepad++
B. Các bước tạo data wiki thành định dạng stardict:
1) Tải về file ...-latest-pages-articles.xml.bz2
2) Giải nén thành file xml (dung lượng sẽ khá to)
3) Dùng WikiToMDict 2.0.exe chuyển file xml thành file txt - định dạng cho MDict
4) Dùng EMEditor (hoặc txt editor khác hỗ trợ file lớn), Find and Replace chuyển thành dạng tab
5) Dùng tab2bgl chuyển thành dạng babylon
6) Dùng RawURLFix để convert các link chứa dấu cách thành dạng link liên kết được
7) Dùng babylon2stardict để convert thành định dạng stardict (Stardict Editor không đủ sức chạy file to, luôn báo lỗi thiếu bộ nhớ - nên cần công cụ này.
Bạn tham khảo thêm các link sau (có các tools kể ở trên, tiếng Hàn - dùng Google Translate nhé ):
http://ybrary.tistory.com/5
http://eu81273.tistory.com/327
http://eu81273.tistory.com/326
=============
C. CONVERT TỪ ĐIỂN LINGVO THÀNH DẠNG STARDICT (BABYLON)
Cơ bản:
+) .lsd = dạng từ điển đã convert của Lingvo
+) .dsl = file nguồn (dạng txt) của Lingvo
+) File txt babylon = File nguồn (txt) của định dạng babylon - từ nguồn này có thể convert thành từ điển cho Stardict (dùng Stardict Editor) hoặc Babylon (dùng Babylon Glossary Builder)
+) Biết dùng DOS Command line
+) Biết sơ qua về xử lý file txt. Gặp lỗi thì bình tĩnh xem vấn đề ở đâu
Các bước tiến hành:
1. Nếu file gốc là dạng .lsd, chuyển về dạng .dsl qua công cụ dslcomp
2. Chuyển file .dsl thành file .txt dạng txt babylon bằng công cụ DSL2BGL
- Copy data .dsl (và các file liên quan) vào cùng thư mục với dsl2bgl.exe (chẳng hạn C:\temp)
- Chạy từ dòng lệnh Command Prompt, tham khảo hình dưới đây:
3. Convert file txt babylon ở bước trên thành dạng stardict bằng Stardict Editor
Xong và enjoy
0 Awesome Comments!