真诚感谢您的到来.我们将更加努力...
传奇Web日志挖掘在校园网建设中的应用 |
| 本文作者: 朱慧爽 朱慧爽(潍坊学院信息与控制工程学院,山东潍坊261061)摘要:本文以某高校校园网日志数据新开传奇为应用实例进行日志挖掘,并根据挖掘结果对校园网网站的结构改进提出了建议。 关键词:数据挖掘Web日志挖掘Agent技术‘1.引言Web是一个开放性的全球分布式网络.资源分布在全球不同的地方,并且网上的资源没有统一的管理和结构,导致了信息搜寻的用难。本文设计了一个利用A黔nt技术实现Web日志挖掘的系统模型,把Web挖掘任务分配给多个Agent来共同完成。包括预处理Agent、数据挖掘Agenl、测试Agent、评价Agent等,每个Agent都有自己的目标,有独立完成任务的能力,也可以和用户等外部环境进行交互。 模型能适用于Web信息处理的各种应用,在信息的个性化推荐、电子商务的个性化服务、智能教学系统的建立、网站结构的改进等方面有应用前景。本文以某高校校园网日志数据为应用实例进行日志挖掘,并根据挖掘结果对校园网网站的结构改进提出了建议。 2.具体应用‘2.1选取数据源实验的数据源为某高校校园网服务器上的日志文件.选取2007年9月份的Web访问日志作为挖掘对象.该校园网主页共链接有18个分类页面,如“学院概况”、“机构设置”、“师资队伍”、“招生就业”、“校园风光”、“图书馆”等,称为一级子页面。一级子页面链接的下一级页面称之为二级子页面.二级子传奇页面共有96个。二级子页面链接的下一级页面定义为三级子页面,以此类推。由于信息量巨大,为了简化实验过程,只选取了8万余条日志进行分析。2.2数据预处理(1)数据净化数据净化是数据预处理的第一项任务.指的是将服务器日志中无意义的、无关紧要的数据去除.仅保留对挖掘有意义的数据。潍坊学院校园网服务器上的日志记录包括用户ID、用户lP地址、用户请求访问的URL页面、请求方法、访问时间、传输协议、传输的字节数、错误代码等属性.而与数据挖掘相关的只有用户IP地址、用户lD、用户请求访问的URL贞面及访问时间,其他属性都可以去掉。另外,URL页面中除了用户关心的正文外.往往还有图像、声音、视频等辅助信息.挖掘Web日志的目的是找出用户的共同访问模式.关于辅助信息的记录是无用的.可以删除。通过检查URL的后缀,将后缀名为GlF、JPEG、JPG、gif、jpeg、jpg、洲f、css、js和mp的请求项删除。(2)用户识别系统使用的技术是基于日志,站点的方法.并辅助一些启发式规则帮助识别用户:不同的IP地址代表不同的用户:用户的IP地址相同。 但相应的代理日志如果显示用户的操作系统或者浏览器类型改变了.就代表不同的用户如果用户的IP地址相同.操作系统和浏览器的类型也相同.则根据网站的页面链接结构对用户进行识别:如果当前浏览的页面同用户已浏览的页面没有超链接关系.那么就认为存在另外有相同IP地址的用户。(3)会话识别系统使用的会话识别方法是使用时间戳timeout.将时间戳设置为30分钟。 如果用户在连续浏览一些页面后,30分钟后再访问了其它的页面。也只把前面所连续访问的页面作为一个页面集如果30分钟之内接着访问了其它页面,则计入同一个会话中。(4)路径补全检查当前引用日志确定引用请求来自哪一页.如果在用户的历史记录中有多个页面都包含于当前请求页的链接.则将请求时间最接近当前请求页的页面作为当前请求的来源。 若引用日志不完整,可以使用站点的页面链接结构代替。通过这种方法将遗漏的页面请求添加到用户的会话文件中。(5)事务识别系统采用的事务识别算法是时间窗方法,具体算法如下:输入:日志L输出:用户访问事务集T’r-NULL:U∞rAcce8sset=P毗ition㈣,/根据每一个IP和代理对划分日志。FOReachuaEUBerAcces8SetBEGINm:sort(ua)/,对每一个访问者的访问记录根据时间升序排列t=NULL:’FOReachl该游戏这一点真行[j]EuaBEGINIF(I[j].timel[j1].time) zhch,60%t8hf+chx,51.6%t妒_+8hI,46.6%3.结果分析及建议Web日志挖掘实验结果表明,玩家愉快访问了xsh.髂p的访问事务几乎一定访问页面lt-html而访问了xsh.asp,lt.htfIll贞面的访问事务也有85.7%的转而访问gsh.硇p页面访问了主页index.鼬p的访问事务中有80.2%转向访问xw.鹊p页面访问index.a印,xw.舾p,1627.htⅡd贞面的访问事务中有75%的同时又访问了1330.htIIll页面.依次类推。结合挖掘出的关联规则.通过对网站用户频繁访问的路径的分析.可以对用户行为在一定程度上进行推测.这种推测对改进网站结构有借鉴作用。通过分析发现网站链接的使用情况受以下几个因素影响:某些贞面上的链接数太多.造成用户搜寻所需信息的壁垒高链接在贞面上所处的位置不合理。比如某些链接用户不用滚动条看不到链接标题与链接指向内容有一定的出入,所以用户很少逗留从而进一步访问下一级贞面等。本着因势利导,兼顾效率的原则,可以在以下几个167网络学习中学习者的角色调整分析郭晓宇(湖南涉外经济学院计算机科学与技术学部,湖南长沙410205)摘要:网络环境下确保网络学习质量是一个难点问题。网络学习中.由于教师交互性主动权的缺失.学习信息反馈渠道不畅,学习监控相对缺乏.影响了网络学习者的学习质量。本文从网络学习者学习的角度出发,初步探讨了网络学习环境中的学习者角色调整等方面的问题.以提高网络学习者的学习质量。 关键词:网硌教学教师角色美国著名的未来学家阿尔温·托夫勒曾预言:“谁掌握了信息,控制了网络.谁就拥有整个世界。 ”信息时代的学习是“一种主动的学习,一种基于信息的学习。一种以多媒体为主要手段的学习,一种建立在网络上的学习”。网络学习已成为大学生学习活动的重要方式之一.也成为当今社会对终身学习能力的一种要求。然而.大学生是否能够有效地利用网络促进自己的学习有效地利用和筛选网络学习资源很好地控制自己的网络学习行为。 抵制网络干扰信息对学习活动的影响呢?英国远教专家伯纳狄特·罗宾森发现,中国学生的整体特征表现为“缺乏自主性、独立性,缺乏自我控制学习能力”。因此在网络学习面前普遍缺乏必要的准备:而西方国家的学生则表现出了很多适应于网络学习的特征。这是由不同教育文化所决定的,中国教育文化是面向社会而不是面向个体和个性发展的,学习的模式是在一个群体中面对面地学习。本文通过对当前大学生网络学习活动的调研.探求影响网络学习效果的因素,探求和完善大学生网络学习能力和习惯的培养措施,希望能够改善网络学习绩效低下的状况。以提高网络学习者的学习质量。一、学习者的角色需转换的外在因素综观国际或国内网络教学发展,基本上趋于模拟实现课堂面授的功能.其中以教师功能的模拟再现为最难。集体面授中教师的功能传授知识、学习监控、管理学生。人们往往注重第一个功能,而忽略后两个微妙却重要的隐性功能.尤其是教师对学生的学习监控。因此,我国网络教学在实施上往往是将一个“单维”的教师搬上了网络,只看到教师传授知识的“知识体”形象传奇之,注重知识内容组织、网络课程设计、学习资源提供等方面,而忘记了对注册学生施加必要的学习监控和采取动机保持措施。传统教育注重发挥教师引导、启发、监控教学过程的主导作用。 网络教育着重体现学生作为学习过程的主动性、积极性与创造性。网络教育可以为学生提供更宽更广的学习环境。学习模式、教学模式的改变使教学真正达到了因材施教、发展个性的目的。网络学习崇尚学习者主体的自主学习.但在网络学习中,师生时空分离,没有了教师对学生面对面的实时监控或权威辐射,学习变得没有监控,学生的学习得以进行的学习动机、自主意识和自控力的保持.对学生本身的素质提出了很高的要求而这往往是最大的问题所在。二、学习者的角色转换的途径和措施(一)更新理论建构主义学习理论认为学习是学习者的建构性活动:知识具有相对性:学习内容包括结构性知识,也包括大量的非结构性的经验背景要重视学习的情境化提倡合作学习。教育评价学的观点认为.学习者评价是对学习者学习进展与行为变化的评价。 学业成就当然是学习者评价的一个内容。但是.学习者除学业成就外,还包括对学习者智能、态度、个性以及兴趣、爱好的评价。一般认为。这种评价有五种功能:了解学习者的学习起点评定学习者的学习结果:使教师了解教学的得失诊断学习者的学习困难激发学习者的学习动机[引。教育评价学的观点认为。学习者的自主学习是一个自我控制的过程.它是学习者在自我激励的基础上自我评价与自我诊断,在发现问题的基础上自我调节的活动。 从自我激励开始,学习者经历了自我诊断、自我调整。最终达到了自我提高。这一周而复始的活动就是学习者自我发展的过程。这种活动的成功将增加学习者的自信与自尊.而自信心的提高将在更大程度上增加学习者自我发展的成功可能性。(二)网络学习环境促进学习者角色调整成功有效的学习不是一个人独自默默苦读的过程。在网络学习环境下.学习不但是个体行为,而且是社会行为,是人与人交往、交流、参与、分享和沟通的过程。网络学习环境支持学习者的网上学习。1.帮助提高学习、T作和研究效率网络学习环境应为学习者提供易于学习的框架以及各类辅助-丁具,如文字处理工具、图形编辑工具、信息搜索工具、学习日程表、书签、笔记本、通信薄、资料收藏夹、导航图等。2.帮助发展思维和解决问题网络技术可以搭建有效的支架帮助学习者开展更高级的思维和学习活动.如,将学习者带入令人激动的、需要解决或解释的疑问和现象的情景描述中:为学习者解决问题提供建模工具通过可视化信息或传奇文章数据帮助学习者分析和验证结论支持学习者有意识地改变某种变量,通过虚拟实验探寻改变变量和结果之间的因果关系:提供概念图帮助学习者组织与表征知识为学习者提供反思和问题思考的支架等。 3.帮助沟通协商和共享学习者需要与网络学习伙伴和辅导者相互交流,进行异步、同步的信息传递和共享。4.辅助学习者的自我管理与自我评价在网络学习中.提供一些自控工具有助于学习者调整自己的学习.建立学习动机,调动学习者的参与性。这些工具通常包括在线测试和练习的及时反馈、学习情况或历史档案的方面对网站链接结构进行调整:(1)建议把导航性页面层次扩大。上面的分析中发现,用户经常通过缓存来访问某些页面.因此建议把导航性页面层次扩大,在同级的页面之间建立超级链接。(2)对于同一导航页面上用户频繁一起访问的页面之间.可以建立链接关系.加强这些页面之问的连通性。(3)调整链接的位置。 根据链接在页面上的位置和与其它页面之间的关系调整其先后顺序。1∞(4)用户访问中一起访问的较深层次的相关内容页面之间应该建立超级链接。参考文献:[1]陆莉娜,杨仪玲,管旭东,魏恒义.Web日志挖掘中的数据预处理的研究[J].计算机工程,2007,26(4):178一179.[2]张艺雪.Web上的数据挖掘及应用[J].信息科技,2007,20(15):7679.。 本文《Web日志挖掘在校园网建设中的应用》 --- 作者: 朱慧爽 |
| 下一篇:Web文本分类技术研究现状述评 |
| 上一篇:Windows Server 2003群集技术在航行情报中的应用 |