java语言中文分词程序怎么编写

来源：学生作业帮编辑：作业帮分类：综合作业时间：2024/11/05 23:21:48

java语言中文分词程序怎么编写
分词程序
正向最大匹配算法：从左到右将待分词文本中的几个连续字符与词表匹配，如果匹配上，则切分出一个词。但这里有一个问题：要做到最大匹配，并不是第一次匹配到就可以切分的。我们来举个例子：
待分词文本： content[]={"中"，"华"，"民"，"族"，"从"，"此"，"站"，"起"，"来"，"了"，"。"}
词表： dict[]={"中华"， "中华民族" ， "从此"，"站起来"}
(1) 从content[1]开始，当扫描到content[2]的时候，发现"中华"已经在词表dict[]中了。但还不能切分出来，因为我们不知道后面的词语能不能组成更长的词(最大匹配)。
(2) 继续扫描content[3]，发现"中华民"并不是dict[]中的词。但是我们还不能确定是否前面找到的"中华"已经是最大的词了。因为"中华民"是dict[2]的前缀。
(3) 扫描content[4]，发现"中华民族"是dict[]中的词。继续扫描下去：
(4) 当扫描content[5]的时候，发现"中华民族从"并不是词表中的词，也不是词的前缀。因此可以切分出前面最大的词——"中华民族"。

现可以提供两种思路:
1.String或是StringBuffer(建议用) 中的indexOf("中华")方法，查找给定的的字符串中是否有给定词表中的词。
2.借鉴编译原理中的状态装换的思想。
先编写一个状态机，用于测试给定字符串中的词是否满足词表中的内容。
写在最后：1)建议使用第一种方法，因为在java 内部实现的查找操作其实和你想得思路是相同的，不过他的效率会高些。
2)如果个人的编程能力比较强或是不考虑效率只是想实现专有的分词算法。可以使用第二种方法。
3)以上的两种方法都可以使用多线程来提高程序的效率。

java语言中文分词程序怎么编写请用java语言编写排序程序. java怎么编写计算分段函数的程序? JAVA语言：编写一个程序,统计出下列段落中单词的个数. 用java语言编写一个程序对任意三个整数进行排序并输出结果随机数生成比较程序：用java语言编写软件是eclitse 用java循环编写一个程序题目. JAVA编写程序输出九乘九乘法表用JAVA语言编写程序19.编写一个译码程序,把一个英语句子译成数字代码.译码规则是以数字 1代替字母 a,数 C语言,怎么编写一个计算自然对数的程序编写一个C语言程序,这道题怎么做? 怎么编写这两个程序（C语言）