|
发表于 2005-3-22 18:04:57
|
显示全部楼层
Post by sofoot
不知道哪位可以解释一下scim-make-table的-if和-of参数怎么用。我找了很久,都没有查到,也试不出来。我现在用自制的郑码(形码的一种),词频都设的是0,所以用起来不顺。
我用的系统是Debian,Scim 1.0.2。
顺便问一下,为什么Scim对于字、词频的处理,不使用统一的库,而是每个码表分开?当然了,现在的做法编程实现可能会比较方便,但是感觉不合逻辑。毕竟字、词频与汉字编码方案是没有关系的。
每种码表的词库都不尽相同,而且有各种语言的码表。而且每种码表对词频的要求都不一样。所以做在一起没有意义。
这两个参数可能不适合你。你可以用 -s 参数,来通过一个语料文件自动学习。语料文件是普通UTF-8编码的文本文件。比如小说,电子书籍等等。 |
|