|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
. A6 f! [) }; C+ K1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介 a z/ Y k2 x
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介! {& Q i* O; r: L
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介2 f# ~: i8 l# z5 O( Q- Y4 Z3 }
1.1.5、黄聪:搜索引擎工作原理-体系结构. A/ [0 V- ]+ X: b+ q5 F
2.1、黄聪:页面搜集原理、技术和系统-基础知识* x! q9 H9 T" _
2.2、黄聪:页面搜集原理、技术和系统-搜集过程% h5 _6 _# o, B: U8 m
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
* T% b' k4 D2 ^: b( \4 T/ n2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集/ M( o% s' P, @& c3 ~! n
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页: Q$ e! i( r q) {( A
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统 a: J; z* C) X+ D/ E
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
) A* U- G; M/ g2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计0 J, Q! X ~+ q2 |
3.1、黄聪:搜集信息的预处理-系统结构& m% O6 h# N- L+ H7 U9 S( c
3.1.1、黄聪:搜集信息的预处理-索引网页库
" W4 Z' k2 }- f0 B. g% ~3.1.2、黄聪:搜集信息的预处理-中文分词技术6 B, L) w: w% }7 E) o5 T
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
c+ ?6 ~) W" L% Z" o- K3.2、黄聪:搜集信息的预处理-网页净化和消重
" H2 L& X' X% M6 A3 U" N3.2.1、黄聪:搜集信息的预处理-净化与数据提取7 d D- x* y; j
3.2.2、黄聪:搜集信息的预处理-网页消重
8 i3 E, {( e& I/ ]1 E% P4.1、黄聪:搜集引擎信息查询服务-网页信息检索
' x; L1 @- Y( G: |/ e7 E4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
# Z5 L5 m( u# V& o% o4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页6 W2 A H5 s! O7 k" W' _
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存3 ] g! g+ Q" r: E; @
5.1、黄聪:用户行为分析-用户查询与点击日志0 t# U, ~! [4 @1 d6 J
5.2、黄聪:用户行为分析-查询日志分析
f+ `5 b' q7 V" T5.3、黄聪:用户行为分析-点击日志分析
) J/ D- f( V) M) r/ S6.1、黄聪:相关排序-网页权重的计算
) Y/ g. ?5 B' f* d' P! D6.2、黄聪:相关排序-网页词项权重的计算" w6 k% e" w! C* \
6.3、黄聪:相关排序-链接权值的计算
2 {: _ s( e! b. n2 j7 B/ T6 E! I6.4、黄聪:相关排序-用户评价权值的计算
5 [6 h* ?3 f+ J) A P0 ]6.5、黄聪:相关排序-最终权值的计算
4 v/ Y& X4 v1 Q. K$ Q7、黄聪:中文网页自动分类技术
6 v: H' g9 R- B2 m- m9 E8、黄聪:搜索引擎工作原理总结0 |. j3 B8 g( g9 H b, k
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu! x$ c$ C% V( H
附2、黄聪:如何搭建TSE搜索引擎
2 t+ ~, O% T z% I$ }5 F4 @- k附3、黄聪:如何让TSE搜索引擎重新抓取网页" K- H6 n7 e4 _& M+ \1 p0 `
4 b9 v$ Y+ u% Q; Y
下载地址:https://pan.baidu.com/s/1gPW1h
& y" j# G- k: V P+ O6 o. ]$ M$ ~8 i |
|