当前位置:首页 > 论文纲要 > 正文内容

论文纲要:异构情况下Web运用发掘体例的接洽与实行

免费论文3年前 (2022-01-23)论文纲要80

跟着互联网络的飞快兴盛,为了使人们不妨在急遽延长的宏大消息中赶快、精确的挑选和定位与自己有价格的消息以及使各个网站处置者不妨创造并猜测人们在互联网络上的动作风气从而对网站的筹备处置和构造框架举行有理安排,“鉴于用户考察日记的Web 运用发掘”(即Web用户考察动作发掘,Web Usage Mining)的接洽越来越惹起人们的关心与关心,它运用Web运用发掘本领领会Web日记数据,居中发掘用户考察形式,猜测用户的潜伏动作, 进而促运用户不妨赶快、精确的定位消息,为网站的筹备处置和构造安排供给计划扶助。在此项接洽本领的普通之上,与派别体例运用情况相贯串,正文提出接洽课题——异构情况下Web运用发掘本领的接洽与实行。正文对准Web运用发掘体例的各个构成局部——数据长途搜集、数据预处置、聚类处置、形式创造和可视化展示,就每个局部的接洽与实行进程中大概遇到的题目和面对的窘境,提出一系列的解计划略与关系本领,进而实行或实行本课题的接洽目的——从Web用户在Web上的考察动作中领会、发掘出Web用户考察形式。正文的重要奉献如次:(1). 提出了Web用户聚类算法;在对已有效户聚类算法的领会与接洽普通上,它运用归纳多重评介成分和引入多级聚类观念,辨别处置了保守用户聚类算法一致生存的“聚类评介成分简单”与“算法本能跟着聚类东西数目的减少而贬低”的题目;试验截止表明:此算法聚类截止的精确性与功效要高于已有算法,更加实用于须要聚类洪量数据东西(即Web用户或Web资源)的情景。(2). 运用已有比拟常用的文本聚类本领实行Web资源聚类;此本领应用华文分词本领对Web文本实质举行特性索取并由那些特性与特性权值形成特性向量,再鉴于它们的特性向量计划Web资源之间的一致度,由文本之间一致度构成一致度矩阵,最后对准一致度矩阵应用文本聚类算法实行Web资源聚类。(3). 实行了Web运用发掘体例;在对Web运用发掘本领的兴盛近况举行深刻领会与接洽之后,安排和实行Web运用发掘体例的各个构造局部——数据长途搜集、数据预处置、聚类处置、形式创造和可视化展示,采用百般与本质情景符合的最优办法,进而保护从Web日记数据中不妨较为精确的领会、发掘出Web用户的考察形式,并最后实行本课题的接洽目的。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。