|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
) t' N0 k* @7 R6 `1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介. q8 n. J2 _* ]) h& q" S/ Q! R, M
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介% X, T" Z1 Q s& _6 b7 V4 ]. u
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介" f# s) f) b9 R! P/ k& M
1.1.5、黄聪:搜索引擎工作原理-体系结构
% z8 {1 l; r( E1 `9 `- X2.1、黄聪:页面搜集原理、技术和系统-基础知识
/ y" `9 u2 q" H$ e( Q& P5 e2.2、黄聪:页面搜集原理、技术和系统-搜集过程7 X- m( n7 v5 z \4 P5 p6 B
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义: b" G$ N: D9 J; w) I
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集% q7 u# {0 h6 V$ ]. Y
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页$ B7 A3 X# Y% j) J( C) B$ o0 B
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
( h! Y# R( q- {8 t! q3 \0 I$ W' S2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略 @# R- m5 h- J' h* U& V* z! g, d/ ?3 N
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
" C! F/ v9 b6 k8 Y, V3.1、黄聪:搜集信息的预处理-系统结构
" H* Y& W' H3 t3 `. L5 O3.1.1、黄聪:搜集信息的预处理-索引网页库
$ E: E# h m0 Z8 |% U6 g* B" q3.1.2、黄聪:搜集信息的预处理-中文分词技术
3 Y2 z; ?% }7 f3 q) C$ n3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
/ q9 F7 v- ]2 R/ K+ E3.2、黄聪:搜集信息的预处理-网页净化和消重* l* C9 Z7 G s
3.2.1、黄聪:搜集信息的预处理-净化与数据提取. x: d5 a, m8 {4 g
3.2.2、黄聪:搜集信息的预处理-网页消重
8 F6 s2 O7 u5 l$ z8 v ?4.1、黄聪:搜集引擎信息查询服务-网页信息检索
7 A6 Y: v- Q& R# g4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
) d, a% B1 y: _- e4 u4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
+ l3 k* F8 @: X1 Y) }4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
) x' k) h) K/ Z5 L( a( A' k3 m5.1、黄聪:用户行为分析-用户查询与点击日志9 F: ?% t+ T" K& ^* X, X+ a. \
5.2、黄聪:用户行为分析-查询日志分析
9 P3 n6 g0 A6 w7 k7 z* \/ B5.3、黄聪:用户行为分析-点击日志分析, G( c" ~, ~6 }
6.1、黄聪:相关排序-网页权重的计算 v" K3 e0 J, F# h) n
6.2、黄聪:相关排序-网页词项权重的计算
! P) Z- S. Y% m% r1 {6.3、黄聪:相关排序-链接权值的计算
. h4 T* r! ]+ y' [/ B8 X6.4、黄聪:相关排序-用户评价权值的计算9 ^( d' d: S; u
6.5、黄聪:相关排序-最终权值的计算7 s2 ^& a {& Z% N+ ]5 Y
7、黄聪:中文网页自动分类技术
. {' t3 Y. f1 l# }1 N# W8、黄聪:搜索引擎工作原理总结( ]$ |& U: S9 O/ \. Z. `
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
9 b6 f9 M3 V. |8 R* x6 P8 T) {5 R附2、黄聪:如何搭建TSE搜索引擎
! ^- h4 m4 e' l1 o: G. U附3、黄聪:如何让TSE搜索引擎重新抓取网页5 j# F3 {& | ~+ }2 }5 q- M
, ]9 t5 q1 v" O; Q7 ^9 k下载地址:https://pan.baidu.com/s/1gPW1h
7 r3 L# ^8 J: J" v |
|