|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
( Z6 T" P3 w' p+ m2 C1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介- T8 R% L5 R( \# X
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介' G4 |# w* R6 y `# B- ]8 N
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介& t0 i" b. D; |+ P1 L
1.1.5、黄聪:搜索引擎工作原理-体系结构
/ |6 {. m/ J* S( H# _. @2.1、黄聪:页面搜集原理、技术和系统-基础知识
% k* ?4 b# w: ^" x! }" s* M+ r2.2、黄聪:页面搜集原理、技术和系统-搜集过程& F h% ?$ t- H7 r
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
% G. R; _# ^$ S( r6 l5 V X4 |2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集! g" B# Y; ^1 ^5 O, @1 T, V- T* }1 b
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页/ {. l% B$ R% |0 P% ?
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
5 V C$ p/ Z) ?2 m: `2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略& `! E& m" g" a {
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计8 R, u! D+ b7 S/ R6 v
3.1、黄聪:搜集信息的预处理-系统结构; H* D9 x9 c# {; B4 K; i' F
3.1.1、黄聪:搜集信息的预处理-索引网页库
0 @* Y3 |% Q% f% W9 E/ w3.1.2、黄聪:搜集信息的预处理-中文分词技术3 j M8 d# a$ L; `! v+ b" z
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件/ }* T& L8 T! }/ c" o/ J, r
3.2、黄聪:搜集信息的预处理-网页净化和消重0 U. _. O. e/ I8 i
3.2.1、黄聪:搜集信息的预处理-净化与数据提取, C# d$ k* ^& O" H& X
3.2.2、黄聪:搜集信息的预处理-网页消重4 ~( ~: o e/ J2 ?8 z! ^+ ?
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
7 y+ x; ]- f6 z- O0 C+ y+ P/ _+ a4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
7 `5 ]. D% X5 E, u7 C1 P& S4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
3 ]9 ?6 v7 b3 u* p9 N( P9 z4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存) \; D" t) {/ W
5.1、黄聪:用户行为分析-用户查询与点击日志& A" S. r4 m) n
5.2、黄聪:用户行为分析-查询日志分析/ m3 f& Z" f6 G( @+ m1 n: p2 ^
5.3、黄聪:用户行为分析-点击日志分析1 R6 ~' A4 R8 Q& M6 h0 a0 R
6.1、黄聪:相关排序-网页权重的计算
/ D: `$ g$ P# K* I2 C" w, Q$ L" |6 ^6.2、黄聪:相关排序-网页词项权重的计算
`0 F$ z8 ^$ k, }# J6.3、黄聪:相关排序-链接权值的计算
7 C0 @) M) R* F4 S% A) `6.4、黄聪:相关排序-用户评价权值的计算
2 V6 H$ L/ E3 S Z6.5、黄聪:相关排序-最终权值的计算/ l8 i# F6 j' B1 D: r8 m; i
7、黄聪:中文网页自动分类技术* c/ z' B5 X8 c( W; i2 o, w1 j$ p |; z
8、黄聪:搜索引擎工作原理总结5 R3 z- s5 d) t' a4 \
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu9 k1 {& t* l5 e8 C2 e
附2、黄聪:如何搭建TSE搜索引擎
6 w+ h- e7 n4 } \! z2 u% v. \附3、黄聪:如何让TSE搜索引擎重新抓取网页8 V$ ^! l3 q3 T) K" B+ U, @
+ Z1 t i, s: Q3 v$ f; r下载地址:https://pan.baidu.com/s/1gPW1h
3 n) t6 }0 L$ @' W. l% d. S3 q |
|