|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
9 U+ o( x% B2 k1 u2 h1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介) R2 f4 s: _, S1 `
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
! x2 @2 a* g0 W# K1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
7 q$ |0 ~; Z( y& x* a; C% T1.1.5、黄聪:搜索引擎工作原理-体系结构. I% t; n9 U* ^, \# @# y" y0 o' p" t% v
2.1、黄聪:页面搜集原理、技术和系统-基础知识
2 x) ]$ ~) y- N1 l! S2.2、黄聪:页面搜集原理、技术和系统-搜集过程1 O: c/ O# h% e X6 G
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
+ b- @1 B } [4 \2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集8 ]3 D8 C6 ~% G# b& u
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页1 V* a0 u# \2 a) a
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
- v9 q0 ^ j, s4 y1 T2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
% E4 P I' Y( m7 M3 i; t2 C2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
/ }/ L* T. u! ]/ ^- {, ?3.1、黄聪:搜集信息的预处理-系统结构
1 |7 ]% m$ Y$ G3.1.1、黄聪:搜集信息的预处理-索引网页库
3 m' e/ H# N; b s3.1.2、黄聪:搜集信息的预处理-中文分词技术
$ c) D3 Q# E, |4 `: v3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件5 J! T1 L+ U! T# h% _9 U
3.2、黄聪:搜集信息的预处理-网页净化和消重
2 B/ S% W) k! h7 X& a3.2.1、黄聪:搜集信息的预处理-净化与数据提取
2 g" L# R6 @# a- z& F z6 e( I3.2.2、黄聪:搜集信息的预处理-网页消重4 l) ~7 W$ t1 Q% H; E r9 L
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
8 m3 s3 Z1 A# {4 }1 g4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
& I9 @5 t0 L$ Q; u0 H3 R4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页$ y6 z0 ]% T8 Q, S' ~
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
# I- R# Z. e* y5.1、黄聪:用户行为分析-用户查询与点击日志
+ \' e! i! G: y: k+ p5.2、黄聪:用户行为分析-查询日志分析
, M4 `# f) ^2 C) Q5.3、黄聪:用户行为分析-点击日志分析
2 d; I! c# E; y3 I6.1、黄聪:相关排序-网页权重的计算
5 x1 h9 l8 x3 v3 n4 o6.2、黄聪:相关排序-网页词项权重的计算# ]4 E$ @. I% L
6.3、黄聪:相关排序-链接权值的计算
+ L* t- i% F% v' i6.4、黄聪:相关排序-用户评价权值的计算+ |: L) I( p, h( u' s7 A
6.5、黄聪:相关排序-最终权值的计算! E8 z5 c+ ~9 B
7、黄聪:中文网页自动分类技术' A6 _' u' e. T
8、黄聪:搜索引擎工作原理总结
L% G* ?: T7 }; G附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
) W8 ^* I5 `2 Y# f附2、黄聪:如何搭建TSE搜索引擎2 v7 ^0 j. H" b2 W& T) z
附3、黄聪:如何让TSE搜索引擎重新抓取网页. I2 H; p1 w- |; \/ k
5 U- M# L6 t: v: `( Q
下载地址:https://pan.baidu.com/s/1gPW1h9 ]; Y) I! D" R* Z
|
|