|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
# l% I% u d" H: p" y" L1 R4 _1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介$ b2 I) U- A: T. P& w$ ]+ `% g
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介5 N- e' H( X5 U3 K9 ` U3 ]
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介0 Y, j; [$ @ i- N2 s+ y
1.1.5、黄聪:搜索引擎工作原理-体系结构
' R2 [2 ] |/ ~) Q2.1、黄聪:页面搜集原理、技术和系统-基础知识
- _) c! W! [' V2.2、黄聪:页面搜集原理、技术和系统-搜集过程$ P1 v% q# b1 q8 p7 d
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义; K" O# a/ T: m0 ^
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集, M& ]; l7 M$ c
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页3 R( P: F& c/ O: J: p7 f
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
) @# P0 r0 S2 ]9 {/ ~2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
# Q5 a2 Y' n* ?+ {7 B& p, B+ j2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计+ M% g- H% i& v( g4 c0 A7 \
3.1、黄聪:搜集信息的预处理-系统结构! \) g9 m! r( u' {! k1 n( O7 J+ Q
3.1.1、黄聪:搜集信息的预处理-索引网页库* Q( x8 ~* u3 }* V( @1 s
3.1.2、黄聪:搜集信息的预处理-中文分词技术. g4 y6 k% ?8 d) ^; l5 R) ~
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
* }6 q, \0 ]/ T7 N. G% ~/ z3.2、黄聪:搜集信息的预处理-网页净化和消重
' w9 g3 k' p5 v0 n, [% Q* ?( [& K& r3.2.1、黄聪:搜集信息的预处理-净化与数据提取
" w, u* q. f( T+ Q- K2 H3.2.2、黄聪:搜集信息的预处理-网页消重
) v. Z- W9 `& p4.1、黄聪:搜集引擎信息查询服务-网页信息检索
0 k3 r% u2 L: @- E' p/ P4.2、黄聪:搜集引擎信息查询服务-中文自动摘要. K3 m% O" p y7 X, V
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页# s2 z. t ^. M. C1 K$ L9 d
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存) f" a: ?& T5 B- n# j
5.1、黄聪:用户行为分析-用户查询与点击日志
# l" I! F8 Q' i! ` ^7 a5.2、黄聪:用户行为分析-查询日志分析
! d/ e, K$ T H% ^# a5.3、黄聪:用户行为分析-点击日志分析
! ~( \) ~! }2 ^6 I6.1、黄聪:相关排序-网页权重的计算
+ K2 X9 b) T: I( O/ Q' w& a3 d& m6.2、黄聪:相关排序-网页词项权重的计算
1 U" q( a; E4 p0 T6.3、黄聪:相关排序-链接权值的计算
[$ |) N3 d) |5 e* w" b! ]6.4、黄聪:相关排序-用户评价权值的计算
7 s6 @& S2 o0 V0 E6.5、黄聪:相关排序-最终权值的计算5 n$ R. d, [* g' V) [/ i, l, J
7、黄聪:中文网页自动分类技术9 U3 d O) m j/ I
8、黄聪:搜索引擎工作原理总结
2 c: W" h% X# Z" z, P6 E& @8 O0 L附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu$ A/ U7 y- X) g: ]& ]: a* z
附2、黄聪:如何搭建TSE搜索引擎
* U2 t! i* S& Y. d附3、黄聪:如何让TSE搜索引擎重新抓取网页9 @6 B, s" `8 d! o# ~& W: U
9 P, v8 d( d+ Y# Z下载地址:https://pan.baidu.com/s/1gPW1h# K. \+ u+ u0 {9 W4 S# r% ?
|
|