当前位置:首页 > 论文摘要 > 正文内容

论文摘要:通用文本处置准则的设置与实行引擎的接洽

免费论文3年前 (2022-01-26)论文摘要58

在消息寰球中,生存洪量的文本处置需要。罕见的文本处置题目囊括消息抽取、消息过滤、统计与领会、消息检索、实质窜改之类。保守本领处置那些题目时,常常是辨别开拓各别的处置步调来处置各别运用,这种处置体制生存少许缺陷:开拓处事烦琐、步调难以重用、开拓速率慢、开拓周期长。所以,保守的文本处置本领没辙符合消息期间赶快兴盛的诉求。正文安排了不妨用来刻画文本处置论理的准则,并实行了用来实行该准则的引擎。进而使开拓文本处置步调的工作简化为开拓处置准则。领会普遍性的文本处置进程,将文本处置的论理归结为三个基础办法:配合、窜改、回写。抄袭这种处置论理安排了准则的数据模子,囊括亚原子准则、准则集、前置前提。而后进一步领会了准则的通用性。运用XML精巧性强且简单编写的个性,设置了准则的文献方法,并给出XML Schema的典型。引擎用来证明并实行准则,实行了处置准则的算法并对算法本能举行了功夫搀杂度的领会。引擎的安排沿用了鉴于OSGi平台的插件化的体制构造,不妨在保护宁静性的基础下,可保护体例能实行精巧的扩充。正文结果供给了两个范例:Web中心文本索取和Blog静态页面包车型的士天生,经过范例考证了正文本领的可行性和适用性。并对引擎实行的本能举行了领会,经过与原生的Java步调的实行开支举行比较,考证了正文本领的灵验性。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。