新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 搜索引擎, 信息分类与检索, 语义搜索, Lucene, Nutch, GRUB, Larbin, Weka
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机技术与应用『 Web挖掘技术 』 → WEB 挖掘工具的介绍 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 8015 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: WEB 挖掘工具的介绍 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     DMman 帅哥哟,离线,有人找我吗?魔羯座1984-1-11
      
      
      威望:1
      头衔:数据挖掘青年
      等级:研二(Pi-Calculus看得一头雾水)(版主)
      文章:803
      积分:5806
      门派:W3CHINA.ORG
      注册:2007/4/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给DMman发送一个短消息 把DMman加入好友 查看DMman的个人资料 搜索DMman在『 Web挖掘技术 』 的所有贴子 点击这里发送电邮给DMman 访问DMman的主页 引用回复这个贴子 回复这个贴子 查看DMman的博客楼主
    发贴心情 WEB 挖掘工具的介绍

    在数据挖掘技术日益发展的同时,许多数据挖掘的商业软件工具也逐渐问世。评价一个数据挖掘工具,需要从以下几个方面来考虑:(1)可产生的模式种类的多少;(2)解决复杂问题的能力;(3)易操作性;(4)数据存取能力;(5)与其他产品的接口。
       通用的数据挖掘工具有,IBM公司Almaden研究中心开发的QUEST 系统,SGI公司开发的MineSet系统,加拿大SimonFraser大学开发的DBMiner系统。处理特定领域的数据挖掘
    工具有IBM公司的Advanced Scout系统针对NBA的数据,帮助教练优化战术组合;加州理工学院喷气推进实验室与天文科学家合作开发的SKICAT系统,帮助天文学家发现遥远的类
    星体;芬兰赫尔辛基大学计算机科学系开发的TASA帮助预测网络通信中的警报。
      上述几种挖掘工具对象可以说主要都是针对结构化的数据进行分析处理,下面主要介绍几种适用于Web挖掘的工具。

    1 文本信息挖掘工具
        通常文本挖掘工具主要完成两方面的工作:信息检索和对文本的分析。文本挖掘工具的主要设计目标是使用户用于理解文档内容或用于收集相关文档所花费的时间最少。IBM 公司推出的WEB文本挖掘工具Intelligent Miner for Text,它是IBM开发的Intelligent Miner家族的一成员,它主要包括三部分:高级搜索引擎TextMiner,其最大特点是具有在线更新的能力,即它在执行索引任务的同时无须将搜索进程挂起,可获得较高的效率;Web访问工具包括一个优化的搜索引擎NetQuestion和web Crawler,Web Crawler是一个可以在一个或多个web 站点启动的自动机,它可以监视web页的活动并可以变更检索使之更优化;文本分析工具,这部分完成的才是对文本信息的挖掘,这部分工具可以独立使用,但将它与文本搜索工具结合使用将能发挥更强大的作用。该软件主要是由信息提取器工具
    组成,该工具提供了高效的文本信息挖掘,可以实现全文搜索、文本分析web文档查询和检索。

    2用户访问模式挖掘工具
        由Stenhen Turner博士编制的免费个人软件Analog,是一个用来分析服务器日志文件的工具,它适用于Windows 及Unix 等操作系统中,由于它的使用较简单,可以直接在服务器上运行,也可以将日志文件下载到客户端,在客户端运行。比较适用于个人和小规模分析应用,是一个实用性很强的日志文件分析工具。从http://www.analog.com/上可免费获得该软件。
         用户导航行为挖掘工具WUM(Web Utilization Miner)是一种序列挖掘器。它主要用来分析用户导航行为的发现,它适用于从任何类型的日志文件中发现用户导航信息。WUM 是一个对日志文件进行集成处理、查询及分析的工具,它的核心是MINT 处理器,主要是对从web日志文件中提取的集成信息进行分析,从而发现导航模式。MINT 是用于用户和挖掘器接口的语言,这种语言为用户提供了更为强大、灵活和全面的功能,它可以根据用户输入的语法标准进行以用户为前提的分析工具。正是因为WUM能提供较强大和灵活的功能,所以对用户也提出了较高的要求。要求用户掌握MINT 语言,并具有能对挖掘结果进行分析处理所具备的知识。MINT 语言语法是一个包含了SQL查询语句中变量和通配符的模板,它与SQL查询语言有类似的语法结构,对用户而言比较容易掌握和使用。可从网
    上免费获得软件MINT5.0 的演示版本,其网址为:http://wum.wiwi.hu-berlin.de/ 。


       收藏   分享  
    顶(0)
      




    ----------------------------------------------
    数据挖掘青年 http://blogger.org.cn/blog/blog.asp?name=DMman
    纪录片之家 (很多纪录片下载)http://www.jlpzj.com/?fromuid=137653

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/5/30 12:23:00
     
     GoogleAdSense魔羯座1984-1-11
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Web挖掘技术 』 的所有贴子 点击这里发送电邮给Google AdSense 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/8/11 19:24:33

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    46.875ms