当前位置:首页 > 行业论文 > 正文内容

行业论文:公安资源检索体例中机动分词及词库的安排与实行

免费论文2年前 (2022-01-23)行业论文82

跟着“金盾工程”的打开,公安网上消息资源以及公安数据库兴盛赶快,树立网站并供给效劳的各级公安部分越来越多,同声数据库的消息量也在不停的增大,那些对公安消息的检索形成了确定的艰巨。为处置这个题目,创造了“公安消息运用资源处置体例”,简称公安资源检索体例。正文重要接洽公安资源检索体例中的机动分词及词库的实行题目。即周旋分词文书档案举行机动分词,以及天生公安专科词库。正文开始接洽了机动分词的国表里兴盛近况,大略引见了机动分词设置和几种常用的机动分词本领及其算法,以及华语机动分词的艰巨和难点。在比较了百般分词本领的优缺陷之后,贯串公安资源的特性,采用了沿用鉴于字符串配合与鉴于统计相贯串的分词本领,简直即为,以双向扫描法为普通,以鉴于统计的分词本领和以鉴于语义的分词本领相贯串的机动分词本领,来周旋分词的文本举行机动分词。同声接洽了该机动分词本领的安排与实行。在词库上面,则重要沿用最大约率算法和准则优化来对公安资源语言材料举行处置,天生公安专科词库。正文以阐明机动分词及词库体例为干线,先比拟了百般机动分词本领的优缺陷,而后给出了机动分词及词库子体例的安排计划,以及各子体例和模块的安排计划。最后给出了分词截止展现,并说领会下一步的处事中心。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。