- 軟件大小:72.27M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件
- 軟件類別:免費軟件 / 編程工具
- 更新時間:2017-06-30 09:45
- 運行環(huán)境:WinAll, WinXP, Win7, Win8
- 軟件等級:
- 軟件廠商:
- 官方網(wǎng)站:http://ictclas.nlpir.org/
385.74M/中文/10.0
3.21M/中文/10.0
21.36M/中文/10.0
3.33M/中文/3.3
8.48M/中文/9.0
nlpir漢語分詞系統(tǒng)是一款適用于編程行業(yè)的中文分詞工具。本軟件支持詞性標準、關鍵詞提取的等功能。主要適用于漢語言詞法分析研究。本站提供的是最新版的icTCLas2016分詞系統(tǒng)安裝程序。需要的用戶歡迎在綠色資源網(wǎng)下載使用。
中國科學院計算技術研究所在多年研究工作積累的基礎上,研制出了漢語詞法分析系統(tǒng)ICTCLAS(InstituteofComputingTechnology,ChineseLexicalAnalysisSystem),主要功能包括中文分詞;詞性標注;命名實體識別;新詞識別;同時支持用戶詞典。我們先后精心打造五年,內(nèi)核升級7次,目前已經(jīng)升級到了ICTCLAS2009用戶詞典接口擴展用戶可以動態(tài)增加、刪除用戶詞典中的詞,調(diào)節(jié)分詞的效果。提高了用戶詞典使用的靈活性。
ICTCLAS詞法分析系統(tǒng),從2009年開始,為了和以前工作進行大的區(qū)隔,并推廣NLPIR自然語言處理與信息檢索共享平臺,調(diào)整命名為NLPIR分詞系統(tǒng)。張華平博士先后傾力打造十余年,內(nèi)核升級十余次,先后獲得了2010年錢偉長中文信息處理科學技術獎一等獎,2003年國際SIGHAN分詞大賽綜合第一名,2002年國內(nèi)973評測綜合第一名。全球用戶突破30萬,包括中國移動、華為、中搜、3721、NEC、中華商務網(wǎng)、硅谷動力、云南日報等企業(yè),清華大學、新疆大學、華南理工、麻省大學等機構:同時,ICTCLAS廣泛地被《科學時報》、《人民日報》海外版、《科技日報》等多家媒體報道。您可以訪問Google進一步了解ICTCLAS的應用情況。
1.指紋提取
根據(jù)文章的內(nèi)容,結構,詞語間的關系,分析出能夠表示該文章的語義指紋,使用數(shù)字序列表示。
2.分詞粒度可調(diào)
可以控制分詞結果的粒度。共享版本提供兩種分詞粒度,標準粒度和粗粒度,滿足不同用戶的需求。
3.用戶詞典接口擴展
用戶可以動態(tài)增加、刪除用戶詞典中的詞,調(diào)節(jié)分詞的效果。提高了用戶詞典使用的靈活性。
4.詞性標注功能加強
多種標注級的選擇,系統(tǒng)可供選擇的標注級有:計算所一級標注級,計算所二級標注集,北大一級標注集,北大二級標注集。
5.關鍵詞提取
自動抽取出能很好地代表文檔主題的若干個詞或短語。關鍵詞抽取技術廣泛應用于信息檢索、文本分類/聚類、信息過濾、文檔摘要等各種智能文本信息處理領域,具有很好的應用價值。
6.新詞發(fā)現(xiàn)與自適應分詞功能
從較長的文本內(nèi)容中,基于信息交叉熵自動發(fā)現(xiàn)新特征語言,并自適應測試語料的語言概率分布模型,實現(xiàn)自適應分詞。
7.微博分詞功能:
對博主ID進行nr標示,對轉(zhuǎn)發(fā)的會話進行自動分割標示(標示為ssession),URL以及Email進行自動標引。
請描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內(nèi)容