|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
% p. h, r; K$ P5 P+ w7 L( B. K1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
: V! Q9 \2 y+ j1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
9 z# T5 d8 q1 e4 f" c2 ~3 z; L1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
7 P9 V0 e& L: _/ u* P/ u1.1.5、黄聪:搜索引擎工作原理-体系结构
, j' E& e/ s# p! K2.1、黄聪:页面搜集原理、技术和系统-基础知识' g, F T$ W- z# \$ u
2.2、黄聪:页面搜集原理、技术和系统-搜集过程; P/ F0 a6 S0 }9 J, g
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义2 M* P$ M+ m+ C; m4 ^' W$ z3 N; ~3 J
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集2 O* @$ i8 a3 j- l/ T$ ?6 w
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
2 n% b$ N# T3 j$ Q/ E$ U: n2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统9 Y* r* _8 {, C4 ?7 h2 C
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
; n# f; g! a' I5 y1 Y2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计$ z. z) r6 l* n& R# Z( V
3.1、黄聪:搜集信息的预处理-系统结构4 p8 A3 [* }, N; O# D" }
3.1.1、黄聪:搜集信息的预处理-索引网页库
& x- q: u8 I e, M. V7 e3.1.2、黄聪:搜集信息的预处理-中文分词技术
7 P) U6 t& E8 G3 A) L/ J7 I: x3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
+ G$ e1 D" A" E" v9 V$ J4 T/ v3.2、黄聪:搜集信息的预处理-网页净化和消重6 C! j( P: ^6 D/ f! A8 w% H V
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
* D: y: a# {9 k" ~. u, }2 [3.2.2、黄聪:搜集信息的预处理-网页消重
: Z* q* ?' n- _: ~. B4.1、黄聪:搜集引擎信息查询服务-网页信息检索) i9 d# p- f+ o1 Q9 ]
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要4 M3 T+ L/ k$ I$ P% E# F3 T: r
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
0 S0 f" f8 a9 m/ G9 x4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
* d) j8 o7 _6 b5.1、黄聪:用户行为分析-用户查询与点击日志
" `4 T B$ Y1 U5.2、黄聪:用户行为分析-查询日志分析/ K5 W; t7 q! i
5.3、黄聪:用户行为分析-点击日志分析
8 }) T: F9 j0 ^6.1、黄聪:相关排序-网页权重的计算
4 E$ L. H2 ?" X6.2、黄聪:相关排序-网页词项权重的计算* B' [& @$ s* _& Z3 O6 ^0 q
6.3、黄聪:相关排序-链接权值的计算# h. G& O& X- I3 g7 G1 w, G/ A% A
6.4、黄聪:相关排序-用户评价权值的计算# p2 V/ K5 e# v* R' h0 h
6.5、黄聪:相关排序-最终权值的计算
' i b e" z$ G+ |7、黄聪:中文网页自动分类技术) V; B1 Z# h0 @/ h1 Z; h& o$ [
8、黄聪:搜索引擎工作原理总结2 Y, U( I. l/ P" O! x8 |) _- Y. u a
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
, K0 C: G9 {" V# k3 a附2、黄聪:如何搭建TSE搜索引擎! a- _# w' I1 O& k4 u3 h7 q3 Z
附3、黄聪:如何让TSE搜索引擎重新抓取网页% s) @3 M$ V3 o3 P& t+ `3 m9 i- o5 k
( D: c4 i/ y1 b6 ^+ [$ |7 e- ^下载地址:https://pan.baidu.com/s/1gPW1h+ w/ [9 }/ S- ^* I
|
|