|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求6 B, d9 o7 [/ d& ~/ r6 {! o
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
4 u2 p$ Q. g& S- Q1 ^1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
/ v. ~( |* J- D1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介2 @. b% X* O; V/ j( ^1 G- ~
1.1.5、黄聪:搜索引擎工作原理-体系结构8 o" `& Q) @# L7 V8 s3 a* g O
2.1、黄聪:页面搜集原理、技术和系统-基础知识' B) s6 ~$ G/ J6 A, O m
2.2、黄聪:页面搜集原理、技术和系统-搜集过程+ d2 |; ~, t3 u' |
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
: q- v/ p$ C3 j& a4 `2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集$ `3 L4 H' D) B3 R
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页% t5 n1 Z8 A/ _, l ^6 |6 Q
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统+ E; I a* `2 K$ \# r+ m2 C1 M
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
' x1 |0 w& e8 [9 z+ |; {7 Q2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计' x7 ?8 Z9 y5 ^, L2 g H1 S
3.1、黄聪:搜集信息的预处理-系统结构
) H/ ~; j# A2 n) F3.1.1、黄聪:搜集信息的预处理-索引网页库
, ? c6 x/ Y* ~/ S) }% J8 P3.1.2、黄聪:搜集信息的预处理-中文分词技术+ ^- M! B9 Y5 w
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
) T" w- u' ]" l( T2 i. l5 U3 Z5 S, G3.2、黄聪:搜集信息的预处理-网页净化和消重
?7 k6 J. p3 u M1 C* X' c; ~3.2.1、黄聪:搜集信息的预处理-净化与数据提取: s& h$ t" k3 P/ H4 [: u
3.2.2、黄聪:搜集信息的预处理-网页消重; Q7 H% n# E; p# r: ^$ c
4.1、黄聪:搜集引擎信息查询服务-网页信息检索& Q1 g& d/ K4 a! B) ]' M
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要( p7 a7 l! Q2 A$ Z% P0 w8 j5 [
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页9 O. D4 Q4 B* P/ T
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
* a7 s, s8 K' M( c" x$ Y3 O5.1、黄聪:用户行为分析-用户查询与点击日志
: Z7 Q, O; W, k1 `' [5.2、黄聪:用户行为分析-查询日志分析- X( [) w _ f4 B o2 \+ B
5.3、黄聪:用户行为分析-点击日志分析$ g- Z, P! C1 j
6.1、黄聪:相关排序-网页权重的计算6 ]! B* _& w9 ]6 y% d m
6.2、黄聪:相关排序-网页词项权重的计算
W; ^/ h Q2 ~6 j" v6.3、黄聪:相关排序-链接权值的计算2 h0 h3 R$ w6 J. l/ S) u# g0 n
6.4、黄聪:相关排序-用户评价权值的计算
6 t6 l2 ]* t6 Q8 u: U* @/ l+ c( n/ k6.5、黄聪:相关排序-最终权值的计算
& F. l; \. U1 m7、黄聪:中文网页自动分类技术6 ]9 V' C3 D |4 l" r2 H2 r
8、黄聪:搜索引擎工作原理总结
* B! {; O' f3 X O1 @; U附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
0 M8 f/ `3 j h% k' J, {3 w附2、黄聪:如何搭建TSE搜索引擎
5 j5 g0 |: w9 ^附3、黄聪:如何让TSE搜索引擎重新抓取网页) D) O. j. c) [- x- s" }9 |
3 d, E/ U! u; H# H Y/ p" P
下载地址:https://pan.baidu.com/s/1gPW1h
d4 |3 g: W2 y; M/ B. B0 u |
|