|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
. l0 m2 I3 ]" {& c; H1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
3 Q' w9 s' B4 C/ q+ s2 I1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
& A4 S1 S, V) F1 h) n1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介% t8 P$ \" I2 p' U. p' N
1.1.5、黄聪:搜索引擎工作原理-体系结构
8 c5 U) p c6 b ?2 |2.1、黄聪:页面搜集原理、技术和系统-基础知识
- Y6 Y) e6 H! G2.2、黄聪:页面搜集原理、技术和系统-搜集过程+ {) L1 X) ]9 u7 U/ C
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
. _5 m! ~ s# l8 _2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集( U# g! b6 {% ]1 g) u* i
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
0 Z/ W, O9 v5 s+ u. B& I: V" B2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统$ e* y& O/ m& [: C& _2 \
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略& g$ Q. `+ v, `9 ^* Q
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
" k T& |9 d! e" D6 S& P: t7 l3.1、黄聪:搜集信息的预处理-系统结构
9 F8 S6 h+ H- `2 i: C' L3 [3.1.1、黄聪:搜集信息的预处理-索引网页库
, Q1 [( N# ?3 T, g* H3.1.2、黄聪:搜集信息的预处理-中文分词技术
& k6 N# y( x8 N* C* @$ o- n+ `' j% Y3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件 U" k) Q# \$ U- i1 l1 k
3.2、黄聪:搜集信息的预处理-网页净化和消重% X$ b$ z/ J% {6 ?% U" C b: S% K
3.2.1、黄聪:搜集信息的预处理-净化与数据提取' a) A- I3 {* ?. E; _7 S' h6 \
3.2.2、黄聪:搜集信息的预处理-网页消重& ~+ {! |# e& h. h7 d% Q) B% G
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
1 z: H- H1 `9 l- {( {4.2、黄聪:搜集引擎信息查询服务-中文自动摘要( R4 D6 @% E% |% J1 X
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页 m6 J8 l! t9 a, T( h
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
$ J9 ?" j: O/ \3 ]" x5.1、黄聪:用户行为分析-用户查询与点击日志
6 I. E) i+ M( T' \' b: i5.2、黄聪:用户行为分析-查询日志分析. M/ J( E' t8 s+ Q' S$ q: x. j
5.3、黄聪:用户行为分析-点击日志分析
b% s* D0 c) j5 f6.1、黄聪:相关排序-网页权重的计算
' ]8 ]. s) K# D4 y: G6.2、黄聪:相关排序-网页词项权重的计算
1 w/ T W- t2 w* T* t; m, s6.3、黄聪:相关排序-链接权值的计算
! m' ^! d( \& K! ?2 L: i/ \6.4、黄聪:相关排序-用户评价权值的计算
8 K- O* V7 M! q, j( R) h# H6.5、黄聪:相关排序-最终权值的计算5 O: J6 E2 a* \, P' p8 u- R
7、黄聪:中文网页自动分类技术
% |6 a+ y9 x* J( \; x0 A8、黄聪:搜索引擎工作原理总结1 u( i7 s2 ~4 u
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu0 _% I, T; a; D! ^/ S
附2、黄聪:如何搭建TSE搜索引擎! H% X, h, p1 p2 d
附3、黄聪:如何让TSE搜索引擎重新抓取网页
1 o" `% Q7 m9 f" f+ |
$ i; q7 t& J; i# X) a* i; e下载地址:https://pan.baidu.com/s/1gPW1h
K" [4 a2 V9 y8 v9 Z+ z3 Z |
|