引言
第1部分 将Web引入数据仓库
第1章 为什么要把Web引入数据仓库
1. 1 为什么说点击流不只是另一种数据资源
1. 2 行为分析
1. 3 隐私保障
1. 4 Web数据仓库的结构
1. 4. 1 用户和ISP
1. 4. 2 公共Web服务器和商业事务
1. 4. 3 热响应缓存
1. 4. 4 Web数据仓库系统
1. 5 小结
第2章 跟踪网站用户的操作
2. 1 用户操作的主要类别
2. 2 购买产品的步骤
2. 2. 1 察觉需要
2. 2. 2 试着找到所需商品
2. 2. 3 搜索关于可替换产品的信息
2. 2. 4 选择
2. 2. 5 相关商品销售和升级商品销售
2. 2. 6 结账
2. 2. 7 订单之后的处理过程
2. 3 购买软件或内容的步骤
2. 4 跟踪的要素
2. 4. 1 用户来源
2. 4. 2 会话识别
2. 4. 3 用户识别
2. 5 行为分析
2. 5. 1 人口点
2. 5. 2 驻留时间
2. 5. 3 查询
2. 5. 4 站点导航
2. 5. 5 出口点
2. 6 关联各种操作
2. 7 个性化的要求
2. 7. 1 重访识别
2. 7. 2 用户界面和内容的个性化
2. 7. 3 相关销售和刺激性销售
2. 7. 4 有效协作过滤
2. 7. 5 工程表和有关生活方式的事件
2. 7. 6 本地化
2. 8 小结
第3章 利用点击流来进行决策
3. 1 关于辨认客户的决策
3. 1. 1 通过识别客户来定制营销活动
3. 1. 2 通过对客户进行集群分析来锁定营销活动的目标
3. 1. 3 决定是否鼓励或者支持引荐相关链接
3. 1. 4 判定客户是否将要离开
3. 2 关于通信的决策
3. 2. 1 判定一个特定的Web广告是否有效
3. 2. 2 判定客户问候是否有效
3. 2. 3 判定促销是否有利可图
3. 2. 4 对客户的生活变化做出响应
3. 2. 5 提高网站的有效性
3. 2. 6 培育社区感觉
3. 3 关于网络业务的基本决策
3. 3. 1 决定通过网络提供哪些产品和服务
3. 3. 2 提供对操作的实时状态跟踪
3. 3. 3 判断我们的Web业务是否有利可图
3. 4 小结
第4章 把点击流理解为数据源
4. 1 Web客户端/服务器互动--概要指南
4. 1. 1 基本的客户端/服务器互动
4. 1. 2 广告
4. 1. 3 引用站点
4. 1. 4 特征文件
4. 1. 5 复合站点
4. 2 代理服务器和浏览器缓冲
4. 3
Web服务器日志
4. 3. 1 主机
4. 3. 2 识别
4. 3. 3 审核
4. 3. 4 时间
4. 3. 5 请求
4. 3. 6 状态
4. 3. 7 字节数
4. 3. 8 访问者
4. 3. 9 用户代理
4. 3. 10 文件名
4. 3. 11 服务时间
4. 3. 12 IP地址
4. 3. 13 服务器端口
4. 3. 14 进程ID
4. 3. 15 URL
4. 4 Cookie
4. 4. 1 Cookie内容
4. 4. 2 Cookie手册--检查自己的cookie文件
4. 5 统一系统标识符
4. 6 查询字符串
4. 7 小结
第5章 支持数据仓库的网站设计
5. 1 单块集成电路与分布式Web服务器的比较
5. 2 使你的服务器同步
5. 3 页面内容标签
5. 3. 1 用于静态HTML的内容索引
5. 3. 2 用于动态HTML的内容索引
5. 3. 3 一个简单的内容索引应用程序
5. 4 一致的Cookie
5. 5 空日志记录服务器
5. 6 个人数据仓库
5. 7 建立信任
5. 8 小结
第6章 创建点击流数据集市
6. 1 多维建模快速浏览
6. 2 点击流维
6. 2. 1 日历日期维
6. 2. 2 一日时间维
6. 2. 3 客户维
6. 2. 4 页面维
6. 2. 5 事件维
6. 2. 6 会话维
6. 2. 7 引荐维
6. 2. 8 产品 或服务 维
6. 2. 9 因果关系维
6. 2. 10 商业实体维
6. 2. 11 点击流追踪关键字
6. 3 点击流数据集市
6. 3. 1 用于分析完整会话的点击流事实表
6. 3. 2 用于分析个体页面使用情况的点击流事实表
6. 3. 3 聚集点击流事实表
6. 4 小结
第7章 装配点击流价值链
7. 1 销售交易数据集市
7, 2 客户通信数据集市
7. 3 网络收益率数据集市
7. 4 针对网络零售商的供应链
7. 5 保险业中的保险单和索赔链
7. 6 销售流水线链
7. 7 卫生保健价值环
7. 8 小结
第8章 实现点击流后处理机
8. 1 后处理机体系结构
8. 1. 1 页面事件提取器
8. 1. 2 内容解析器
8. 1. 3 会话识别器
8. 1. 4 计算驻留时间
8. 1. 5 主机和引用站点解析器
8. 2 小结
第2部分 把数据仓库引入Web
第9章 为什么要把数据仓库引入Web
9. 1 Web拉动数据仓库
9. 2 Web推动数据仓库
9. 2. 1 紧化用户界面反馈回路
9. 2. 2 查询与更新的整合
9. 2. 3 速度是不可商量的
9. 2. 4 Sun从不设置Web数据仓库
9. 2. 5 多媒体合并到通信中
9. 2. 6 Web是大规模定制的
9. 2. 7 网络仓库是深度分布式的
9. 2. 8 我们必须面对安全及其隐私问题
9. 3 小结
第10章 设计用户体验
10. 1 两次革命之间的差异
10. 2 第二代用户界面指导方针
10. 2. 1 确保准瞬态性能
10. 2. 2 满足用户要求
10. 2. 3 让每个页面都成为愉快的体验
10. 2. 4 简单化过程
10. 2. 5 安定用户
10. 2. 6 提供分解问题的手段
10. 2. 7 建立信任
10. 2. 8 提供通信钩子 Communication Hook
10. 2. 9 支持国际化透明
10. 3 小结
第11章 通过网库驱动的数据挖掘
11. 1 数据挖掘的起源
11. 2 数据挖掘的行为
11. 3 数据挖掘的准备工作
11. 3. 1 一般的网库数据转换
11. 3. 2 适用于所有形式的数据挖掘的数据转换
11. 3. 3 依赖于数据挖掘工具的特定的数据转换
11. 4 将数据提交给数据挖掘工具
11. 5 OLAP. 数据挖掘和网库
11. 6 小结
第12章 创建国际Web数据仓库
12. 1 发展中的国际Web
12. 1. 1 UNICODE
12. 1. 2 并行的超文本和机器翻译
12. 1. 3 多语言搜索
12. 1. 4 时区转换服务
12. 1. 5 节日查找服务
12. 2 国际网库技术
12. 2. 1 在多个时区和时间格式之间实现同步
12. 2. 2 支持多国日历和日期格式
12. 2. 3 集中多种货币形式的收入
12. 2. 4 处理国际名称和地址
12. 2. 5 支持不同的数字格式
12. 2. 6 支持国际电话号码
12. 2. 7 处理跨国查询. 报表和对照序列
12. 2. 8 本地化在Web数据仓库中的应用
12. 3 小结
第13章 Web数据仓库安全
13. 1 推荐的安全技术
13. 1. 1 提供双因素认证
13. 1. 2 保护连接
13. 1. 3 将通过认证的用户与角色联系在一起
13. 1. 4 通过角色访问所有的网库对象
13. 2 管理安全过程, 而不是解决方案
13. 3 小结
第14章 网库的缩放
14. 1 网库不是Web服务器
14. 2 点击流活动突变
14. 2. 1 上网人数增长
14. 2. 2 越来越多的点击率
14. 2. 3 用户级自动搜索
14. 2. 4 更深的经济渗透
14. 2. 5 一夜成名
14. 2. 6 IP成为一种通用传输协议
14. 2. 7 XML--通用传输
14. 3 对数据仓库服务需求的剧变
14. 4 软硬件的严重瓶颈
14. 4. 1 避免单一瓶颈
14. 4. 2 避免进程重复
14. 4. 3 物理上的考虑:托管
14. 4. 4 操作系统
14. 4. 5 编程语言
14. 4. 6 数据库
14. 4. 7 查询和报告软件
14. 4. 8 平衡电子邮件和链接的使用
14. 4. 9 硬件特性
14. 5 粒度权衡
14. 6 小结
第15章 管理网库项目
15. 1 定义项目
15. 2 确定角色
15. 2. 1 全体决策人员:主管与监督人
15. 2. 2 教练:项目经理和领导
15. 2. 3 常规阵容:核心项目团队
15. 3 搜集业务需求和审计数据
15. 4 计划并管理实现
15. 5 启动系统
15. 6 回过头来再做一遍
15. 7 小结
第16章 网库的未来
16. 1 CRM将继续推动Web数据仓库
16. 2 更好地描述行为
16. 3 我们最终将需要数据挖掘
16. 4 ISP拥有一座金矿
16. 5 寻求更好的搜索引擎
16. 6 数据能否战胜存储和速度
16. 7 数据库的完全转置
16. 8 网站应用程序日志
16. 9 每件东西都是一个模块
16. 10 小结