|
1.1.1、黄聪:搜索引擎的工作原理-基础要求: x% k9 F5 j/ |4 y4 G7 c
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介" \! ?. m2 C6 o) I9 p
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
$ H1 x/ N6 C7 g" z! l- O( \1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
2 S% c! V2 e8 ^0 {& o& r8 W1.1.5、黄聪:搜索引擎工作原理-体系结构
* ]; F& k. b& H! p2.1、黄聪:页面搜集原理、技术和系统-基础知识
/ q& Z; A! f7 [+ C# S# o2.2、黄聪:页面搜集原理、技术和系统-搜集过程0 a% I( R9 M0 \% Y. W& U/ o) N
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
3 i( I6 O: _6 S# l2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集- ~: q. f7 _% U6 L; O
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
! {% a0 l+ j0 l! d I7 \2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统- u3 N. O4 j( {' Y
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
- V' ?8 J6 L' T' g; o2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计2 O8 r4 n9 W6 f. q* C
3.1、黄聪:搜集信息的预处理-系统结构2 W! B- \% x# s3 l# n3 \8 b
3.1.1、黄聪:搜集信息的预处理-索引网页库0 d* ?8 p0 @; T5 J3 y
3.1.2、黄聪:搜集信息的预处理-中文分词技术) @ F/ l7 j! [
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
% Y3 B) t! r7 r$ J4 f9 z% k3.2、黄聪:搜集信息的预处理-网页净化和消重
; D$ |8 Q7 S1 P# r2 b3.2.1、黄聪:搜集信息的预处理-净化与数据提取
5 F5 s: ]6 b$ q9 n6 q. I5 W5 u3.2.2、黄聪:搜集信息的预处理-网页消重
* l \3 w; A- M4.1、黄聪:搜集引擎信息查询服务-网页信息检索
' w* k; K+ B$ F2 t: D/ x0 T4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
7 l. O+ K6 i: [1 |! n6 X4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页8 n2 M, K. u6 n, K, ]
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
1 f; q3 @. {7 X5.1、黄聪:用户行为分析-用户查询与点击日志
/ x7 P+ j1 q9 V( x7 t5.2、黄聪:用户行为分析-查询日志分析: v$ s, r4 K7 a( b- X
5.3、黄聪:用户行为分析-点击日志分析
, t0 G. G; v5 R i8 D# j6.1、黄聪:相关排序-网页权重的计算. B8 y9 O9 l' ]8 [, w# F6 V) i! J- F
6.2、黄聪:相关排序-网页词项权重的计算
" h& e) a4 p7 P) S: r6.3、黄聪:相关排序-链接权值的计算) B/ m$ G' N; e. o
6.4、黄聪:相关排序-用户评价权值的计算3 t. h: S% C' U$ t3 l& N
6.5、黄聪:相关排序-最终权值的计算3 ^5 ~9 g1 i! B( P4 k! h
7、黄聪:中文网页自动分类技术
* \: d* Q! |# e0 H' e% L. Y2 |8、黄聪:搜索引擎工作原理总结; Y {6 Z! R& [) |7 L: I
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
* H6 _$ ?& r3 v6 z$ @* D o附2、黄聪:如何搭建TSE搜索引擎
6 U# j& v3 J$ v+ _: I/ ?$ o附3、黄聪:如何让TSE搜索引擎重新抓取网页
5 f! b9 K: ^) W+ k8 e
- b4 d( e* {) F# f4 J6 C% x下载地址:https://pan.baidu.com/s/1gPW1h
( ]# o+ Y. }! k F7 {3 j8 { |
|