|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求) f& ~8 {. R) K4 h* V2 j
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介; j2 q) S, ?$ h" X& u+ `" c; C
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介' b Z7 v8 e8 f5 K) n8 \
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介7 u3 @2 D( I3 F" k8 S4 L9 X' U
1.1.5、黄聪:搜索引擎工作原理-体系结构6 e' W; Z- R( K/ w2 g
2.1、黄聪:页面搜集原理、技术和系统-基础知识3 o D4 `( S: I l9 C
2.2、黄聪:页面搜集原理、技术和系统-搜集过程
9 `: w- } A7 ^! e6 r2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义2 I/ \7 J1 `7 M# u) H8 n
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集: G4 X9 p4 {5 w( I9 o
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页" F' p' j+ A; y1 [9 k
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统& X7 x j* v) D8 j
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
4 Q# a3 Z5 R i7 J2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计7 T; R0 Q/ |. O3 q6 f! S
3.1、黄聪:搜集信息的预处理-系统结构0 R# d" s( _! S
3.1.1、黄聪:搜集信息的预处理-索引网页库
( r1 I; m0 ~9 `/ z1 x+ ?$ G. i3.1.2、黄聪:搜集信息的预处理-中文分词技术- F+ E$ D5 T# K1 {, y# F! _; g
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
( O5 A: N$ {" f( N1 F- R3.2、黄聪:搜集信息的预处理-网页净化和消重; ]; G8 y7 c, S, I1 _. T
3.2.1、黄聪:搜集信息的预处理-净化与数据提取4 R0 w& l# ~* `6 |) \+ G4 j
3.2.2、黄聪:搜集信息的预处理-网页消重; [; x4 A7 V% s3 _4 N
4.1、黄聪:搜集引擎信息查询服务-网页信息检索$ T2 G/ H: f) q h% p. j" C/ b6 a
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要! g5 q( p n. n8 a- ]
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页% h! l6 Z$ Q& H; \6 ?
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存3 Y( g8 L/ M0 p2 J) q
5.1、黄聪:用户行为分析-用户查询与点击日志
+ X& c/ a% N3 z; d; r3 K5.2、黄聪:用户行为分析-查询日志分析
- Y& l/ z* I6 A2 j0 I0 u6 {5.3、黄聪:用户行为分析-点击日志分析! }: I M2 z5 @: V- P5 \. q, d
6.1、黄聪:相关排序-网页权重的计算2 @& ? ]( g1 c6 r& g, |+ q. v
6.2、黄聪:相关排序-网页词项权重的计算4 X O6 \/ I4 k" P- `
6.3、黄聪:相关排序-链接权值的计算/ i& }! A" Z7 N$ O* o) J& L
6.4、黄聪:相关排序-用户评价权值的计算# ^4 a7 w0 e8 z4 f9 V) L _# s
6.5、黄聪:相关排序-最终权值的计算. M) q+ ?, Y+ C0 t' t
7、黄聪:中文网页自动分类技术
" ^1 }/ J8 e; u* o4 r2 b( N8、黄聪:搜索引擎工作原理总结
, D" C3 ]+ C. A3 k! P, S附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
! @) d2 D$ ~, y5 T' ?2 x$ t; d附2、黄聪:如何搭建TSE搜索引擎8 }& u: W* g. ?6 J. X
附3、黄聪:如何让TSE搜索引擎重新抓取网页
( E" j, V8 o+ X( I
( \$ ?) R) q3 Y; A, S- v5 W下载地址:https://pan.baidu.com/s/1gPW1h; Y8 |* a% b! y1 X$ B- [. s
|
|