|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
# G s; ?( z+ B M$ h$ a1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介2 ^: c: u* S" J0 u4 v
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介: _, Y5 h) c( _
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
. b4 b) J- l! a( Q9 B* Q `5 o: L1.1.5、黄聪:搜索引擎工作原理-体系结构
: f% Q9 f! E$ ?% e2.1、黄聪:页面搜集原理、技术和系统-基础知识
0 \4 @: i. e! o m, `0 d+ {2.2、黄聪:页面搜集原理、技术和系统-搜集过程
& [! K# c F+ o1 u8 g# O; ^2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
; V; S* z0 G1 D# g! V2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集! H8 z" d4 { j
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页1 k, F6 u4 G" {
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统- o* \8 P6 U7 n1 a
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
+ L. {: O& ]/ D& @% B: }3 Q2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计; ]5 G( Q: R8 V. S/ m
3.1、黄聪:搜集信息的预处理-系统结构5 }6 Y$ H% V2 a$ @1 Q; s8 j- `
3.1.1、黄聪:搜集信息的预处理-索引网页库
, v) A0 t0 e7 I) N6 S' \9 z9 ?3.1.2、黄聪:搜集信息的预处理-中文分词技术
1 P/ y1 w N4 U1 Y! |3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件9 K' v9 D0 ]% O" K
3.2、黄聪:搜集信息的预处理-网页净化和消重
+ m5 H8 \7 w! R0 e- }' J# p% N3.2.1、黄聪:搜集信息的预处理-净化与数据提取9 e V( f* P$ e3 P. L1 t
3.2.2、黄聪:搜集信息的预处理-网页消重' E- ?6 f) g: f8 U
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
? {, r# f" u7 u! {0 P a4.2、黄聪:搜集引擎信息查询服务-中文自动摘要& s6 J, [9 r4 i& v+ [. ]
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页. v4 E! L6 t5 p2 p3 L/ G5 O0 q' {2 A
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
2 ?5 ^ Y( o6 A) Y7 K5.1、黄聪:用户行为分析-用户查询与点击日志9 h7 c: i, C1 }
5.2、黄聪:用户行为分析-查询日志分析
8 e5 H9 p1 z C3 a" w/ w5.3、黄聪:用户行为分析-点击日志分析
' z$ n5 A- h. C6.1、黄聪:相关排序-网页权重的计算
' F S5 C% O p, |+ L: ^; E- K4 o6.2、黄聪:相关排序-网页词项权重的计算
' p+ ~ Y U" p5 q6.3、黄聪:相关排序-链接权值的计算
1 |2 Y: I! C2 y9 P# j# D- @# q6.4、黄聪:相关排序-用户评价权值的计算1 M* n6 C% r m, x1 T% ^: j; ^- l
6.5、黄聪:相关排序-最终权值的计算
, f0 G: \ T3 n( f& W& y: X7、黄聪:中文网页自动分类技术5 n7 [" s$ z! H8 x
8、黄聪:搜索引擎工作原理总结0 `6 B: g! B* ~8 e' a- N
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
2 E7 A8 e) u; n! \附2、黄聪:如何搭建TSE搜索引擎
5 |, d9 ?+ k3 w, i/ g1 Q附3、黄聪:如何让TSE搜索引擎重新抓取网页
7 N( q2 }8 t+ R ~3 J% j
6 z; v' ], O9 Y+ U- B下载地址:https://pan.baidu.com/s/1gPW1h
6 S( l, t! X% h' w |
|