|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求+ z. Z. N/ X9 U+ ^; }
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介' Y7 _4 i/ K, k3 t/ N
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
$ i+ P0 b9 G) J1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介& m' Q& S7 F* t* s& B, x
1.1.5、黄聪:搜索引擎工作原理-体系结构) H, A: c* W/ n
2.1、黄聪:页面搜集原理、技术和系统-基础知识
. e, h/ F( [) y: {) Y3 ^2.2、黄聪:页面搜集原理、技术和系统-搜集过程1 |$ ]9 t- P0 w1 v7 K- f
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
2 c" G% B( H* B# b- G2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集/ l6 Z6 G0 c) b- Q/ |: }# j
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
* F* e! [$ C3 I! C2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
5 M4 H' }0 _& A2 u! P6 d* M" ?2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略1 \1 O. H+ x# {/ A* |3 c2 l9 d
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
% g+ x2 I( C: [0 P3.1、黄聪:搜集信息的预处理-系统结构( Q$ A. E. z- S5 [! m
3.1.1、黄聪:搜集信息的预处理-索引网页库
6 m! y" B: D q% u5 ?0 U9 U5 v3.1.2、黄聪:搜集信息的预处理-中文分词技术* A0 E( }- z! ~1 Z' V. Q( D, @, b/ f
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
3 X' F; ]" ?- S8 b/ _8 b- ~1 C3.2、黄聪:搜集信息的预处理-网页净化和消重
7 Z5 x1 F- V% Z) j0 g8 J6 |. i3.2.1、黄聪:搜集信息的预处理-净化与数据提取
. H: k9 R x2 X9 Q9 d: Y* l E3.2.2、黄聪:搜集信息的预处理-网页消重+ _- F. O0 c8 j# @* M# X. K( F5 Q, c
4.1、黄聪:搜集引擎信息查询服务-网页信息检索 K$ w# }9 e& Z$ u
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
% F5 r( w6 z4 v& V8 b: c1 Z4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
! I; r8 W; u6 q) k& U3 l4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存6 I% j) u9 ]& J1 M- ~ ~
5.1、黄聪:用户行为分析-用户查询与点击日志0 T0 D: W. v. a
5.2、黄聪:用户行为分析-查询日志分析
0 Y2 n4 E( x% Z+ t7 V1 e5.3、黄聪:用户行为分析-点击日志分析
! c% U# x2 L- r3 ]7 P# G. \ ^6.1、黄聪:相关排序-网页权重的计算
; T% L0 Y9 G( ^. s' U- }( I, \6.2、黄聪:相关排序-网页词项权重的计算2 P5 N ~6 R0 j+ N4 P. N% g
6.3、黄聪:相关排序-链接权值的计算
) ^% x. I9 z; u. [* p; g6.4、黄聪:相关排序-用户评价权值的计算
& `; g9 I; Y- o6 m* d% X# O6.5、黄聪:相关排序-最终权值的计算
8 r6 e% a& n$ J" R, p) V) l7、黄聪:中文网页自动分类技术) z' k% S' ~8 z$ I0 O/ g
8、黄聪:搜索引擎工作原理总结0 p1 N: }7 R% b7 V# U' R' Z
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
4 S Q* @. C, V, a附2、黄聪:如何搭建TSE搜索引擎
7 D; Z9 q7 F0 M, N+ K" M) o- @附3、黄聪:如何让TSE搜索引擎重新抓取网页
/ R/ w; K' A# G5 w3 w l
1 N6 C+ R% T( L' d% Y下载地址:https://pan.baidu.com/s/1gPW1h( z: e$ r9 P7 |9 K+ ]5 y3 x
|
|