注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络信息系统Web搜索

Web搜索

Web搜索

定 价:¥31.00

作 者: 郭军 著
出版社: 高等教育出版社
丛编项:
标 签: 管理信息系统(MIS)

购买这本书可以去


ISBN: 9787040278170 出版时间: 2009-08-01 包装: 平装
开本: 16开 页数: 294 字数:  

内容简介

  《Web搜索》内容包括导论、文本检索、图像检索、音频检索、信息过滤、信息推荐以及发展前沿。对Web搜索的基本概念进行定义,阐述其科学价值和研究状况,根据Web搜索所涵盖的检索、过滤以及推荐技术,论述其中的核心问题、基本概念和基本方法,并介绍Web搜索若干新的研究方向。《Web搜索》的最大特点是将Web上的信息检索、过滤和推荐等技术定义为Web搜索,使其具有比较宽泛的内涵。将Web检索、过滤和推荐统一在一个体系中,既符合这三项技术发展的现状和趋势,又便于读者进行系统的学习和研究。另外,《Web搜索》紧跟近年来的最新研究进展,具有显著的先进性和独特性。《Web搜索》可以作为信息、通信、计算机类研究生或高年级本科生的教材和教学参考书,也可作为专业技术人员的阅读和培训资料。

作者简介

  郭军,教授,现任北京邮电大学信息与通信工程学院院长,日本东北学院大学博士、博士生导师。主要学术兼职包括国家自然科学基金委员会信息科学部学科评审组成员、北京市科学技术奖评审专家组成员、北京市计算机与控制学科高级职称评审组副组长、中国人工智能学会理事、中国自动识别协会专家组成员、中文信息处理学会理事等。主要社会兼职包括北京市政协委员、北京市高级知识分子联谊会理事、中共中央统战部信息员等。现主要从事Web搜索、模式识别、网络管理等方面的研究。在SCIENCE、IEEE Trans.on PAMI、IEICE Trans、ICPR、IOOV、SIGIR等模式识别、计算机视觉以及信息检索领域国际顶级刊物和会议上发表了多篇论文。出版著作6部,其中《网络管理》一书被评为首批(2004年)北京市精品教材。

图书目录

第1章 导论
  1.1 Web搜索的定义
  1.2 Web搜索的发展背景
  1.3 Web搜索的挑战性
  1.4 Web搜索的科学价值
  1.5 Web搜索的研究状况
  1.6 本书的内容
  
  第2章 文本检索
  2.1 引言
  2.2 Web信息采集
  2.2.1 Crawler的基本原理
  2.2.2 Crawler的工作效率
  2.2.3 Crawler的难题
  2.3 文本的保存与索引
  2.3.1 预处理
  2.3.2 文本的保存
  2.3.3 文本的索引
  2.3.4 索引词的选取
  2.4 检索模型
  2.4.1 Boolean模型
  2.4.2 VSM
  2.4.3 概率模型
  2.5 网页排序
  2.6 查询重构
  2.6.1 用户相关反馈
  2.6.2 自动局部分析
  2.6.3 自动全局分析
  2.7 文本聚类
  2.7.1 区分法
  2.7.2 生成法
  2.8 文本分类
  2.8.1 K-NN分类器
  2.8.2 Bayes分类器
  2.8.3 最大熵分类器
  2.8.4 区分式分类器
  2.9 特征选择
  2.9.1 包含算法
  2.9.2 排除算法
  2.1 0特征变换
  2.1 0.1 自组织映射
  2.1 0.2 潜语义标号
  小结
  习题
  
  第3章 图像检索
  3.1 引言
  3.2 图像检索的发展过程
  3.3 文本自动标注
  3.3.1 基于二维多粒度隐:Markov模型的二类标注
  3.3.2 有监督的多类标注SMI
  3.4 物体识别
  3.4.1 星群模型
  3.4.2 异构星状模型
  3.5 文字识别
  3.5.1 引言
  3.5.2 离线文字识别系统
  3.5.3 非线性归一化
  3.5.4 余弦整形变换
  3.5.5 方向线素特征抽取
  3.5.6 渐进式计算的马氏距离分类器
  3.5.7 基于模具的文字切分
  3.6 人脸检测与识别
  3.6.1 Adaboost人脸检测算法
  3.6.2 常见的人脸识别算法
  3.6.3 非限定性人脸识别算法
  3.7 视频检索
  3.7.1 概述
  3.7.2 镜头切分
  3.7.3 视频摘要
  小结
  习题
  
  第4章 音频检索
  4.1 引言
  4.2 声学特征抽取
  4.2.1 时域特征抽取
  4.2.2 频域特征抽取
  4.3 HMM模型
  4.3.1 基本概念与原理
  4.3.2 3个基本问题及其经典算法.
  4.4 连续语音识别系统
  4.4.1 基于HMM的语音识别统一框架
  4.4.2 声学模型
  4.4.3 语言模型
  4.4.4 解码器
  4.5 语音关键词发现技术
  4.5.1 基于垃圾模型的关键词发现
  4.5.2 语音关键词发现中的核心问题
  4.5.3 一个侧重确认的语音关键词发现系统
  4.6 语音词汇检测技术
  4.6.1 混淆网络
  4.6.2 一个基于音节混淆网络的STD系统
  4.7 非语音音频检索
  4.7.1 概述
  4.7.2 声学模型
  4.7.3 语义模型
  4.7.4 声学空间与语义空间的联系
  4.8 音乐检索
  4.8.1 概述
  4.8.2 哼唱检索
  4.8.3 基于语义描述的音乐标注及检索
  小结
  习题
  
  第5章 信息过滤
  5.1 引言
  5.2 基本方法
  5.2.1 基于Bayes分类器的过滤
  5.2.2 基于向量距离分类器的过滤
  5.2.3 基于k近邻分类器的过滤
  5.2.4 基于SVM的过滤
  5.2.5 系统性能评价
  5.3 模型学习
  5.3.1 生成式与区分式学习
  5.3.2 降维变换
  5.3.3 半监督学习
  5.3.4 演进式学习
  5.4 垃圾邮件及垃圾短信过滤
  5.4.1 垃圾邮件过滤系统
  5.4.2 垃圾短信的过滤
  5.5 话题检测与跟踪系统
  5.5.1 报道分割
  5.5.2 事件检测
  5.5.3 事件跟踪
  小结
  习题
  
  第6章 信息推荐
  6.1 引言
  6.2 关联规则挖掘的基本算法
  6.2.1 基本定义
  6.2.2 Apfiofi关联规则挖掘算法
  6.2.3 基于FPT的算法
  6.3 可信关联规则及其挖掘算法
  6.3.1 相关定义
  6.3.2 用邻接矩阵求2项可信集
  6.3.3 由k项可信集生成(k+1)项可信集
  6.3.4 基于极大团的可信关联规则挖掘算法
  6.4 基于FPT的超团模式快速挖掘算法
  6.4.1 相关定义
  6.4.2 基于FPT的超团模式和极大超团模式挖掘
  6.5 协同过滤推荐的基本算法
  6.6 基于局部偏好的协同过滤推荐算法
  6.7 基于个性化主动学习的协同过滤
  6.8 面向排序的协同过滤
  小结
  习题
  
  第7章 发展前沿
  7.1 内网检索及对象检索
  7.2 基于文档的专家检索
  7.2.1 基于文档的专家表示
  7.2.2 基于文档的专家检索
  7.3 对象检索及信息抽取
  7.3.1 对象检索的基本概念
  7.3.2 信息抽取
  7.4 基于Web的对象检索
  7.5 博客检索
  7.6 TREC中的博客观点检索
  7.7 文本情感分析
  7.7.1 文本情感分析中的特征抽取
  7.7.2 情感分类模型
  小结
  习题
  参考文献

本目录推荐