|
1.1.1、黄聪:搜索引擎的工作原理-基础要求' i& L0 O6 ~8 v- @9 Q! [) ^- m
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
8 D8 |1 j% H% V( A2 t w1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
- `9 T( G' {6 O- _0 I2 v1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介% f: C/ R( L# `/ {& e* B( r
1.1.5、黄聪:搜索引擎工作原理-体系结构
- g6 b3 y; [8 R) m- r* C2.1、黄聪:页面搜集原理、技术和系统-基础知识+ y; ? [' ^- e
2.2、黄聪:页面搜集原理、技术和系统-搜集过程
8 q/ Y1 n1 `. _$ l) s9 J1 a- c2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义& O. Z( l6 F* l% `5 ?, Z
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集0 c$ ~. R/ x4 n& n7 Y' B$ Q/ r
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
% [. a, L4 L/ J, Z" ]/ e2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
2 A; H8 X& [& m# d |2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
" ~0 W5 s3 p, X, |; v2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
?$ u0 N7 |( P0 v/ R3.1、黄聪:搜集信息的预处理-系统结构
$ |' k" L( W2 }: w2 z' o3.1.1、黄聪:搜集信息的预处理-索引网页库
& A3 z6 \7 {4 J: {( G ^3.1.2、黄聪:搜集信息的预处理-中文分词技术
6 B: a3 |1 I# K; ^/ Q3 O, Y2 Z3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
( {/ L& @& O% [5 K x3.2、黄聪:搜集信息的预处理-网页净化和消重
]+ H3 m1 g7 X) s3.2.1、黄聪:搜集信息的预处理-净化与数据提取1 {$ i9 C& V* K; T2 r
3.2.2、黄聪:搜集信息的预处理-网页消重- T( s: f t# R& Y
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
2 J9 |; T/ I6 G$ o$ l4 d4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
@( s2 m7 O+ `2 W4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页& Y/ g# G+ A! J8 O( M( M S
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
5 ]% b3 W( b5 J1 w2 _" o- Q5.1、黄聪:用户行为分析-用户查询与点击日志7 C) @, j$ H. U! I5 W& [2 ?1 W
5.2、黄聪:用户行为分析-查询日志分析
7 m Q/ t4 [, F5 w5.3、黄聪:用户行为分析-点击日志分析
% [' h$ a" T Z# B" [& }6.1、黄聪:相关排序-网页权重的计算2 I. H$ c& J) B- }9 T" U! q1 j
6.2、黄聪:相关排序-网页词项权重的计算
5 X M7 s* H: E+ _8 ]6 s) D8 |6.3、黄聪:相关排序-链接权值的计算
2 t" [: R9 m+ w3 @* _6.4、黄聪:相关排序-用户评价权值的计算$ P$ L% c& S m, S" }# i% R8 k
6.5、黄聪:相关排序-最终权值的计算7 g9 d3 P3 _9 `6 }% @
7、黄聪:中文网页自动分类技术' L2 I3 x% J4 ^: k8 m+ }# R
8、黄聪:搜索引擎工作原理总结9 H& ^$ Z- F& Z9 f9 I: G
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
* |# `' [4 f r8 B. Y+ }附2、黄聪:如何搭建TSE搜索引擎: S) h6 B! W% T3 _7 e, J
附3、黄聪:如何让TSE搜索引擎重新抓取网页
6 \2 V* w& V6 Y# U$ l: b% l. }% W# H+ I
下载地址:https://pan.baidu.com/s/1gPW1h# M2 N r' S( e
|
|