public class InitDictionary
extends java.lang.Object
| Modifier and Type | Field and Description |
|---|---|
static int |
arrayLength
DAT数组长度
|
static int[] |
base
base: 数组用来存放单词的转换..其实就是一个DFA转换过程
|
static int[] |
check
check: 数组用来验证里面存储的是上一个状态的位置
|
static char[] |
IN_SYSTEM
所有在词典中出现的词,并且承担简繁体转换的任务.
|
static byte[] |
status
status: 用来判断一个单词的状态 1.为不成词.处于过度阶段 2.成次也可能是词语的一部分.
|
static TermNatures[] |
termNatures
frequency : 词性词典,以及词性的相关权重
|
static java.lang.String[] |
words
words : 数组所在位置的词
|
| Constructor and Description |
|---|
InitDictionary() |
| Modifier and Type | Method and Description |
|---|---|
static char |
conversion(char c)
简繁体转换,
|
static int |
getWordId(java.lang.String str)
一个词在词典中的id
|
static void |
initArrays()
对于base,check,natrue,status的加载 0.代表这个字不在词典中 1.继续 2.是个词但是还可以继续 3.停止已经是个词了
|
static void |
initArrays(java.io.BufferedReader reader) |
static boolean |
isInSystemDic(java.lang.String str)
判断一个词是否在词典中存在
|
public static int arrayLength
public static final char[] IN_SYSTEM
public static int[] base
public static int[] check
public static byte[] status
public static java.lang.String[] words
public static TermNatures[] termNatures
public static void initArrays()
throws java.lang.Exception
java.lang.Exceptionpublic static void initArrays(java.io.BufferedReader reader)
throws java.lang.Exception
java.lang.Exceptionpublic static boolean isInSystemDic(java.lang.String str)
str - public static int getWordId(java.lang.String str)
str - public static char conversion(char c)
c - 输入'孫'Copyright © 2013. All Rights Reserved.