|
|
NLPIR大數(shù)據(jù)語義智能分析平臺在文本信息提取介紹方面,,能夠?qū)崿F(xiàn)新詞提取和關(guān)鍵詞提取,。
新詞發(fā)現(xiàn)能從文本中挖掘出具有內(nèi)涵的新詞、新概念,,用戶可以用于專業(yè)詞典的編撰,,還可以進一步編輯標注,導入分詞詞典可提高分詞系統(tǒng)的準確度,,并適應(yīng)新的語言變化,。新詞提取內(nèi)容包括:詞語、詞性,、權(quán)重和詞頻統(tǒng)計,。本步驟所得到的新詞, 可以作為分詞標注器的用戶詞典導入,,從而使分詞結(jié)果更加準確,。
關(guān)鍵詞提取能夠?qū)纹恼禄蛭恼录希崛〕鋈舾蓚€代表文章中心思想的 詞匯或短語,,可用于精化閱讀,、語義查詢和快速匹配等。關(guān)鍵詞提取能夠?qū)纹恼禄蛭恼录?,提取出若干個代表文章中心思想的 詞匯或短語,,可用于精化閱讀,、語義查詢和快速匹配等。關(guān)鍵詞分析內(nèi)容包括: 詞語,、詞性,、權(quán)重和詞頻統(tǒng)計。系統(tǒng)默認詞匯以權(quán)重值高低排序,。
同時,,NLPIR大數(shù)據(jù)語義智能分析平臺能夠?qū)崿F(xiàn)對于新詞、關(guān)鍵詞提取結(jié)果的高維可視化展示,,可視化形式有三種:文 本格式,、二維格式與三維格式。用戶可根據(jù)需要直接使用,,無須再次設(shè)計美化,。
|