LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: trotsky

四种拼音输入法的比较以及拼音输入法开发[讨论篇]

[复制链接]
发表于 2003-6-29 08:34:20 | 显示全部楼层
最初由 stormful 发表
能不能提供一些紫光在Linux下的资源统计信息。比如内存和CPU情况。测试CPU可以通过反复算便键入一些随机的内容得到。


简单测试了一下
数据都是在gnome-system-monitor中监测所得。
在vi中键入随即数据一分钟以上,不再有变化为止。
随即输入内容得到内存占用2.4M,CPU偶尔为1,一般情况下为0。

输入发为红旗rfinput中的紫光,只保留了拼音模块,如智能,全拼。
其余已经删除(因为用不到)。
紫光激活前内存占用为1.9M。
只保留紫光拼音的话我有过1.1的占用。
发表于 2003-6-29 17:21:25 | 显示全部楼层
当然,我也知道这一点,但是这只是一个小小的遗憾。
微软拼音是在所有拼音输入法中最强的,这不容否认,其次是苏哲的scim。


我觉得中文之星的智能狂拼才是最强的拼音输入法
除了和某些windows程序有些不兼容外
其整句输入功能是最强的
基本上不需要再做修改。
发表于 2003-6-29 19:16:47 | 显示全部楼层
最初由 Apollo 发表
简单测试了一下
数据都是在gnome-system-monitor中监测所得。
在vi中键入随即数据一分钟以上,不再有变化为止。
随即输入内容得到内存占用2.4M,CPU偶尔为1,一般情况下为0。

输入发为红旗rfinput中的紫光,只保留了拼音模块,如智能,全拼。
其余已经删除(因为用不到)。
紫光激活前内存占用为1.9M。
只保留紫光拼音的话我有过1.1的占用。


感谢Apollo的帮助。不过,rfinput应该不是紫光的核心部分。应该有另一个进程好像叫upimd。在windows下紫光2.3的这个进程好像叫upengine。我想紫光不会向redflag提供代码的,redflag写一个紫光的输入界面倒是非常可能的。

今天我终于搞明白了紫光的next-one的基本运作模式,并且已经统计出了该运作模式下的统计信息。结果应该是非常接近的。在一段时间后的测试报告中,我会详细阐述这方面的内容。

我这两天写了一个拼音分析树。我现在基本上能够确定有意义的几个分支的特征是什么样子的。但具体确定某个分支就非常困难了。大家能不能提供些想法,哪怕一些拼音串也是好的。呵呵,我现在甚至想,干脆搞个自动下拉式的窗体,看好哪个就用哪个。

由于没有进一步的概念和资料,我打算最近要收工了。现在我可能要写一个基于xim的界面。有这方面的老大能提一些建议么?
发表于 2003-6-29 21:16:43 | 显示全部楼层
第一次用紫光的拼音我也怀疑怎么内存占用这么小呢,原来还有一个Upimd.
我的upimd的内存占用基本上在3.5,CPU在1%。
看来你也一定知道了。
发表于 2003-6-29 21:30:13 | 显示全部楼层
只是3.5M么?这令我非常矛盾。从文件级上来说也不只如此。一般情况下文件级一般要远大于内存级,或者远远小于。看了紫光真是由非常有效率的程序员所编写的。我现在还没有加入准确的next-one的情况下,已经消耗了5M内存。呵呵,看来,还需要思索。

呵呵,我不知道紫光在linux下的具体情况。只是猜测。另外还有楼上兄弟提供的资料。感谢你提供的资料,我再想想可腾挪的空间。
发表于 2003-6-30 09:30:43 | 显示全部楼层
最初由 stormful 发表
感谢Apollo的帮助。不过,rfinput应该不是紫光的核心部分。应该有另一个进程好像叫upimd。在windows下紫光2.3的这个进程好像叫upengine。我想紫光不会向redflag提供代码的,redflag写一个紫光的输入界面倒是非常可能的。

今天我终于搞明白了紫光的next-one的基本运作模式,并且已经统计出了该运作模式下的统计信息。结果应该是非常接近的。在一段时间后的测试报告中,我会详细阐述这方面的内容。

我这两天写了一个拼音分析树。我现在基本上能够确定有意义的几个分支的特征是什么样子的。但具体确定某个分支就非常困难了。大家能不能提供些想法,哪怕一些拼音串也是好的。呵呵,我现在甚至想,干脆搞个自动下拉式的窗体,看好哪个就用哪个。

由于没有进一步的概念和资料,我打算最近要收工了。现在我可能要写一个基于xim的界面。有这方面的老大能提一些建议么?


建议你使用 SCIM 平台,这样你就可以完全不用关心 XIM 和界面的问题了。你只需要关心算法就好了。
发表于 2003-6-30 18:45:47 | 显示全部楼层
最初由 james_su 发表
建议你使用 SCIM 平台,这样你就可以完全不用关心 XIM 和界面的问题了。你只需要关心算法就好了。


感谢james_su的好意。如果这个程序要作为一种拼音输入法发布的话选择scim平台或许是一个不错的主意。但这样作违背了我设计这个程序的初衷。我写xim的代码主要是自己使用。我不想再接触其他框架或规范了。毕竟,在这个程序上我已经花费了太多的时间和精力。如果继续发展下去,从个人经济利益角度上来说,这是非常不划算的。

这个程序在设计的初期只是要解决词频统计问题,后来才随着理解的深入加入了很多东西。因此从开始开发到现在它的开发模式都不是打阵地战。如果要作为拼音输入法发布可能还要需要1个月的时间。呵呵,这太不划算了。我更希望花一周的时间写一个设计文档,让更多的人对拼音输入法感兴趣。并投入到拼音输入的开发中来。

我感觉,个人的力量是非常渺小的。在这个论坛上就经常可以看到3种主流输入法的作者:fcitx、scim和xsim。每个人都在开发一套自己的东西。拼音输入法可以含盖输入法的很多问题。有了这些核心技术,就可以非常容易的开发出完整的解决方案。为什么不集中大家的力量,开发出一种完全Free的主流输入法哪?

我感觉,讨论的价值是无法衡量的。我们写这些输入法都是为了什么?
发表于 2003-6-30 18:59:43 | 显示全部楼层
最初由 stormful 发表
感谢james_su的好意。如果这个程序要作为一种拼音输入法发布的话选择scim平台或许是一个不错的主意。但这样作违背了我设计这个程序的初衷。我写xim的代码主要是自己使用。我不想再接触其他框架或规范了。毕竟,在这个程序上我已经花费了太多的时间和精力。如果继续发展下去,从个人经济利益角度上来说,这是非常不划算的。

这个程序在设计的初期只是要解决词频统计问题,后来才随着理解的深入加入了很多东西。因此从开始开发到现在它的开发模式都不是打阵地战。如果要作为拼音输入法发布可能还要需要1个月的时间。呵呵,这太不划算了。我更希望花一周的时间写一个设计文档,让更多的人对拼音输入法感兴趣。并投入到拼音输入的开发中来。

我感觉,个人的力量是非常渺小的。在这个论坛上就经常可以看到3种主流输入法的作者:fcitx、scim和xsim。每个人都在开发一套自己的东西。拼音输入法可以含盖输入法的很多问题。有了这些核心技术,就可以非常容易的开发出完整的解决方案。为什么不集中大家的力量,开发出一种完全Free的主流输入法哪?

我感觉,讨论的价值是无法衡量的。我们写这些输入法都是为了什么?


如果你真的想自己开发一个 XIM 输入法服务器自己用,也建议你使用 SCIM。因为 IMdkit 并不是那么好用,而且自己写界面也是很麻烦的。

你把学习 IMdkit 和写界面的时间拿来学习 SCIM 都绰绰有余了。

我的 SCIM 就是想试图统一 Linux 环境下中文输入法的平台。让输入法的开发者专心去开发输入法算法,而不是花大部分时间在开发界面等琐碎的事情上。

但可惜的是目前还没有人响应 SCIM。
发表于 2003-6-30 19:38:40 | 显示全部楼层
最初由 james_su 发表
如果你真的想自己开发一个 XIM 输入法服务器自己用,也建议你使用 SCIM。因为 IMdkit 并不是那么好用,而且自己写界面也是很麻烦的。

你把学习 IMdkit 和写界面的时间拿来学习 SCIM 都绰绰有余了。

我的 SCIM 就是想试图统一 Linux 环境下中文输入法的平台。让输入法的开发者专心去开发输入法算法,而不是花大部分时间在开发界面等琐碎的事情上。

但可惜的是目前还没有人响应 SCIM。


对于界面方面我是非常矛盾的。这个程序在内存方面体现了非常矛盾的特性。在统计方面它基本上是在玩海量内存,基本上在400M左右。在runtime时,它在玩微内存。基本上在5-6M左右。KDE在每个应用上占有的内存都不少。我不太清楚共享库的具体运作模式,但看看KDE最小的程序也要20M左右,我有些气馁。我现在打算抄袭QT的widget_x11.CPP来完成这个工作。

SCIM没有人响应是有其原因的。我这个人说话比较直接,可能很不中听。但我的性格就是这样。

主要的原因在于你所说的那个“我的SCIM”。这太有个人色彩了,这不是Free世界的风格。

其次SCIM并没有非常好的解决广大用户的一些普通问题。这可能是XIM的问题,其他输入法也是如次。至于说我嘛,我根本就不想解决这方面的问题。除非能参与X11的设计,否则没有办法。但有多少人愿意这么作么?即要兼顾输入法,又要试图参与X11。这太难了。

再次,我感觉对于广大使用这来说,开发人员需要耐心。可能一个问题非常简单,但不是所有的人都能达到你这样的水平,或者对SCIM像你这样了解。这些人中就有很多技术上或资料上的捐献者。

最后,你的那个拼音输入模块伤透了我的心,可能很多人也这么想。如果没有这个拼音输入模块可能也没有现在的diy了。

我想我们不会在这些输入法中得到什么,我们的目的只是让中国的计算机用户能过上好日子。这里面存在商业么?可能存在。我在统计这些资料的时候,统计出一个非常大的集合。大约有100M。这就是中国人的说话方式。如果写一个input server,这就是商业行为。但挣国内公司的钱我的内心更平和些。
发表于 2003-6-30 19:48:30 | 显示全部楼层
我说 “我的 SCIM”是事实,至少目前是事实。到现在为止 SCIM 的主要开发者还是我,liuspider <liuspider@21cn.com> 大侠帮助我解决了一些通用码表输入法里面的 bug, LIANG ChangTai <beos@turbolinux.com.cn> 给我提供了很多好的建议,foka@debian.org 兄帮我作了 SCIM 的 debian 包,他的同事 fei 帮我捉住了一个通用码表输入法里面的 bug。除此而外再没有人给 SCIM 贡献过什么了。当然, SCIM 本身有很多代码是他人的劳动成果,SCIM 也不是从0开始的。

如果我的拼音输入法模块伤了你的心,我觉得就太搞笑了点。你要是觉得我的拼音输入法模块不好,当他不存在好了,何必这样呢?

SCIM 本身作为一个开放的输入法平台是独立的,我还是希望大家多支持支持。

最初由 stormful 发表
对于界面方面我是非常矛盾的。这个程序在内存方面体现了非常矛盾的特性。在统计方面它基本上是在玩海量内存,基本上在400M左右。在runtime时,它在玩微内存。基本上在5-6M左右。KDE在每个应用上占有的内存都不少。我不太清楚共享库的具体运作模式,但看看KDE最小的程序也要20M左右,我有些气馁。我现在打算抄袭QT的widget_x11.CPP来完成这个工作。

SCIM没有人响应是有其原因的。我这个人说话比较直接,可能很不中听。但我的性格就是这样。

主要的原因在于你所说的那个“我的SCIM”。这太有个人色彩了,这不是Free世界的风格。

其次SCIM并没有非常好的解决广大用户的一些普通问题。这可能是XIM的问题,其他输入法也是如次。至于说我嘛,我根本就不想解决这方面的问题。除非能参与X11的设计,否则没有办法。但有多少人愿意这么作么?即要兼顾输入法,又要试图参与X11。这太难了。

再次,我感觉对于广大使用这来说,开发人员需要耐心。可能一个问题非常简单,但不是所有的人都能达到你这样的水平,或者对SCIM像你这样了解。这些人中就有很多技术上或资料上的捐献者。

最后,你的那个拼音输入模块伤透了我的心,可能很多人也这么想。如果没有这个拼音输入模块可能也没有现在的diy了。

我想我们不会在这些输入法中得到什么,我们的目的只是让中国的计算机用户能过上好日子。这里面存在商业么?可能存在。我在统计这些资料的时候,统计出一个非常大的集合。大约有100M。这就是中国人的说话方式。如果写一个input server,这就是商业行为。但挣国内公司的钱我的内心更平和些。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表