PALMisLIFE 討論區

搜索
鹹魚爸魅力四射舞蹈教室
查看: 5337|回復: 6
打印 上一主題 下一主題

*** 超級字典!! 超級苦力請進! ***

[複製鏈接]

15

主題

0

好友

125

積分

該用戶從未簽到

文章
96
跳轉到指定樓層
1#
發表於 2001-9-26 20:41 |只看該作者 |倒序瀏覽
http://home.pchome.com.tw/soho/ezfox/CeDic/CeDic.html
  
這個字典我已經 porting 到幾乎所有的 O/S
從 DOS, Win32, HP-UX, Solaris, Linux, BSD, FreeBSD, NetBSD,...
  
就差 Palm & EPOC, 不知道有沒有人有興趣來 porting?
  
一些較詳細的技術背景:
  
1. 字庫有 16Mb, 所以 Palm 一定要用 VFS, 放擴充卡上
2. 原始檔 engine 用 C 寫的, UI 可自行決定 C or C++.
3. 原來就用 BIG5 編碼, 不用管 Unicode 問題
4. Palm 上面比較麻煩要解決的有:
  
a. File 要轉 DB 嗎?  
b. 要設計一下 UI, 妥善使用畫面空間, 可參考 Palm 譯點通 等
c. 音標?
d. 原來的 code 在 local veriable 用量太大, Palm 要做 optimize
e. 搜尋速度在 Palm 上要考慮是否 optimize. 是否取消 regular exp  
改用 binary search?
  
為了以後的維護性, 要求使用 Metrowerks CodeWarrior 來開發,  
前提是 bin 要 free release, src 相互 NDA 授權.
有興趣的跟我聯絡吧... 我會給您 password 存取 private 網頁中
的 source.
  
沒人有興趣的話, 只好等我把我的  Palm Vx
換成 TRG pro, or M505 等可插卡的機器, 才有動機去 porting 了...
  
fox
分享淘帖0 分享分享0 收藏收藏0 頂0 踩0

396

主題

0

好友

1453

積分

   

該用戶從未簽到

文章
3487
2#
發表於 2001-9-26 21:29 |只看該作者

回覆: *** 超級字典!! 超級苦力請進! ***

灌水...
  
果然是大計劃...
  
16MB....  嗚.... 如果是搜尋英文還好... 可以先把英文排好...
但是我看那個網頁中的範例.... 還可以搜尋a*d... 還可以搜尋中文...
那要找中文時不是要讀過所有的資料(16MB)才能知道有哪筆資料可以符合的嗎? 還是有table?
這樣可是很費時間的耶...  
如果沒記錯的話要先鎖定記憶體再搬動到RAM比對... 然後再比對下一個Record
  
現在火車時刻表在卡上的執行的速度會那麼慢就是這樣...
要讀過每一個Record(一個車次就一個Record)... 然後再排序....
主要的原因是資料跟本是無法先排序.... -_-~
  
純灌水...
回復

使用道具 舉報

396

主題

0

好友

1453

積分

   

該用戶從未簽到

文章
3487
3#
發表於 2001-9-26 21:31 |只看該作者

回覆: *** 超級字典!! 超級苦力請進! ***

哇...
( 16MB ) 變成 (16MB)
回復

使用道具 舉報

51

主題

0

好友

493

積分

該用戶從未簽到

文章
457
4#
發表於 2001-9-26 23:44 |只看該作者

回覆: *** 超級字典!! 超級苦力請進! ***

像是電子書方面,現在我都是直接讀卡上的txt檔,
畢竟轉檔還是麻煩一點,直將把原檔放在卡上,方便且快多了,
而且可以針對演算法對檔案格式最佳化,
不過,這對沒讀卡機的人就有點吃虧了。
--
ARM Palm快出來吧~~~~~~~
好多AP都等者您呢~
回復

使用道具 舉報

15

主題

0

好友

125

積分

該用戶從未簽到

文章
96
5#
發表於 2001-9-27 08:25 |只看該作者

回覆: *** 超級字典!! 超級苦力請進! ***

ㄟ... 其實這個計劃不會很大啦...
  
主要是要花時間, 保守估計熟 CW & VFS 的人應該 1 周內可以搞定,
DB 主要有幾個 .e.g.
  
A.dat - A 字母的詳細中文解釋
A.idx - A字母的 index 檔排序過
  
所以如果使用 binary search 應該是很快的, 只是沒有 regular exp.
對很多人會覺得不方便, 像我常常記得發音, 可是到底母音是
a, e, 還是 i, e 分不清, 那就常常用 "am.*r" 這種方式來找,  
真的是太方便了.
  
這個可以用程式技巧解決, e.g. 發現有 Regular Exp 才用 regcmp()
不然使用 binary search index file.
  
中文部分使用另一個 DB, e.g.  
  
SHORT.idx
SHORT.dic
  
這個部分只有 2Mb 以內, 所以用 seq. search 還好啦...
  
其實當初 hacking 它, 最大的困擾在於它的 DB 格式有加密, 然後
又不希望有版權問題, 所以不能另外新建 DB 來散佈, so...
  
fox
回復

使用道具 舉報

15

主題

0

好友

125

積分

該用戶從未簽到

文章
96
6#
發表於 2001-9-27 08:44 |只看該作者

回覆: *** 超級字典!! 超級苦力請進! ***

嘻嘻... 看電子書我也是改用 txt 格式的檔案了,  
因為真的懶得去轉檔, 用 txt 的可攜性高多了.
  
像 CE 雖然有 AP 可以看 *.pdb 可是支援的格式
不夠多, 較新的 iSilo 編碼的文件常常開不起來.
  
所以, 最近我也去敗了 128Mb CF, 反正現在
CF 真的便宜, 兩千塊搞定!!
  
只是 Palm 上面插 CF 的只有 TRG Pro, 我又不想
去買 TRG Pro, 其他插卡機型敗下來沒有一兩萬
搞不定, 所以還是用我的便宜 AERO1550 + Palm Vx.
  
自己要 porting 也沒機器測... 然後自己用不到
動機就不夠強... ^_^
  
fox
回復

使用道具 舉報

15

主題

0

好友

125

積分

該用戶從未簽到

文章
96
7#
發表於 2001-9-27 23:17 |只看該作者

回覆: *** 超級字典!! 超級苦力請進! ***

退而求其次, 打算先轉成 KDIC db 吧!  
只是 KDIC 沒有音標.  
anyway, 有 solution 總比沒有好.
  
fox
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免費註冊

與站長聯繫| PALMisLIFE 掌上生活      下載:更快、更棒、更好玩

GMT+8, 2024-5-9 07:01 , Processed in 0.048846 second(s), 30 queries , Gzip On.

Powered by Discuz!

© 2001-2012 Comsenz Inc. style by eisdl

回頂部