中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

Jcseg 2.5.0 發(fā)布,Java 輕量級開源自然語言處理包

2019-09-09    來源:OSCHINA

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

Jcseg是基于mmseg算法的一個輕量級中文分詞器,同時集成了關(guān)鍵字提取,關(guān)鍵短語提取,關(guān)鍵句子提取和文章自動摘要等功能,并且提供了一個基于Jetty的web服務(wù)器,方便各大語言直接http調(diào)用,同時提供了最新版本的lucene,solr和elasticsearch的分詞接口!

 

Jcseg 2.5.0更新如下:

1,修復(fù)NLP模式下部分“第xx”實體識別的position錯誤的bug (Reported by https://gitee.com/lionsoul/jcseg/issues/I10FKC)。

2,修復(fù)elasticsearch插件的詞庫autoload的bug(Reported by https://gitee.com/lionsoul/jcseg/issues/IWT2P)。

3,對于全部的切分模式增加同義詞自動詞性繼承。

 

4,增加elasticsearch 7.2.0支持和lucene, solr 8.0.0支持 (Reported by https://gitee.com/lionsoul/jcseg/issues/IZ7GS)。

5,lucene,solr,elasticsearch檢索同義詞解決方案與Jcseg同義詞方案結(jié)合。

6,修復(fù)了lucene以及其擴展產(chǎn)品Elasticsearch, solr等同義詞以及派生詞 (例如,中文數(shù)字轉(zhuǎn)阿拉伯數(shù)字)的高亮的bug。

這個問題打Jcseg增加同義詞以來一直都有的問題,issue中被提了很多次,感謝以下的issue和信息提供者,已經(jīng)測試OK了

  • https://gitee.com/lionsoul/jcseg/issues/IM8GD
  • https://gitee.com/lionsoul/jcseg/issues/IMBLD
  • https://gitee.com/lionsoul/jcseg/issues/IRLA2
  • https://gitee.com/lionsoul/jcseg/issues/IRLA2
  • https://gitee.com/lionsoul/jcseg/issues/IXA40
  • https://gitee.com/lionsoul/jcseg/issues/I11505
  • https://github.com/lionsoul2014/jcseg/issues/46

 

7,jccseg-server更改jetty版本號為:9.4.18.v20190429。

8,詞條格式調(diào)整為:“詞條/詞性集合/拼音/實體集合/自定義參數(shù)”。

9,少量詞庫優(yōu)化 。

 

下載地址:

Gitee: https://gitee.com/lionsoul/jcseg/tree/v2.5.0-release

Github: https://github.com/lionsoul2014/jcseg/releases/tag/v2.5.0-release

Maven倉庫地址:

<dependency>
????<groupId>org.lionsoul</groupId>
????<artifactId>jcseg-core</artifactId>
????<version>2.5.0</version>
</dependency>

 

標簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:NetBox 2.6.3 發(fā)布,IP 地址與數(shù)據(jù)中心管理工具

下一篇:Apache Spark 2.4.4 發(fā)布, 開源集群計算環(huán)境