|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求# }8 w2 w K, A g( D$ h5 l [ f
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
. i: c3 E( Q8 n! ], E& Q1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
5 O$ j* h7 d$ ?$ @8 |1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介+ U3 D+ [+ h" x* [
1.1.5、黄聪:搜索引擎工作原理-体系结构" R: Q: }# |& S' w7 G) v6 N/ l/ d# w
2.1、黄聪:页面搜集原理、技术和系统-基础知识- Q+ {3 x5 A/ L! Y4 q: f$ N- q! w
2.2、黄聪:页面搜集原理、技术和系统-搜集过程+ y0 r9 U0 }$ m3 V6 A5 Y
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
& x; |' Y; P- f& b2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
8 }8 N" K6 g) ?. p2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
# Z: g0 D3 P$ j7 Q: Z/ ^* h2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统$ Q9 @7 i5 y' c: F
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
g! |, ~3 T: Q0 o2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计/ v& b. a4 J# J" e- M$ K
3.1、黄聪:搜集信息的预处理-系统结构
" R9 V% }# f0 f$ q3.1.1、黄聪:搜集信息的预处理-索引网页库
8 {' [6 I5 ^( |0 k3.1.2、黄聪:搜集信息的预处理-中文分词技术
( U7 j) \0 @" k, H7 L3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
* M* Z4 r; g/ o0 `3.2、黄聪:搜集信息的预处理-网页净化和消重
+ }4 E. @; w9 D G" ^2 ?$ a# u3.2.1、黄聪:搜集信息的预处理-净化与数据提取
3 z% A% `! K2 V0 I( s) w3.2.2、黄聪:搜集信息的预处理-网页消重
- M% k$ Q& D# a- x3 E4.1、黄聪:搜集引擎信息查询服务-网页信息检索
: f1 P7 [, E& a; V2 G+ ^9 \3 H4.2、黄聪:搜集引擎信息查询服务-中文自动摘要3 d* t0 D5 ]% _' w2 V) @* Z
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页1 [% Q2 c6 @4 j8 B$ f: C; p
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
% D, g8 V* d7 R5 X4 g8 A5.1、黄聪:用户行为分析-用户查询与点击日志
+ |# S8 B+ \3 Y5.2、黄聪:用户行为分析-查询日志分析& M! ?/ F3 V" ^) @( U
5.3、黄聪:用户行为分析-点击日志分析$ B7 i8 D6 M: B) m3 ]4 V
6.1、黄聪:相关排序-网页权重的计算2 O; `' `% M0 \$ o3 v( e- }- j
6.2、黄聪:相关排序-网页词项权重的计算0 D6 y6 l( t9 M
6.3、黄聪:相关排序-链接权值的计算, G! I' H; K2 [
6.4、黄聪:相关排序-用户评价权值的计算# P. ~% T$ m9 Z; m* s" U9 U
6.5、黄聪:相关排序-最终权值的计算
3 m% @! f' N: d* k+ Y0 r1 ?7、黄聪:中文网页自动分类技术
( q6 z: _: x+ }' [% V% t8、黄聪:搜索引擎工作原理总结
! c: o2 f( D4 ^7 u& R* Q4 B% I& t, V附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu5 K1 O% @, }" L
附2、黄聪:如何搭建TSE搜索引擎
. a4 y8 }/ N' Y9 |+ H附3、黄聪:如何让TSE搜索引擎重新抓取网页$ N e' a: K3 O+ r5 S
) G: ?2 x1 ?! v' G( j
下载地址:https://pan.baidu.com/s/1gPW1h
; l' @" r' `: p( l# W+ z7 t |
|