|
1.1.1、黄聪:搜索引擎的工作原理-基础要求! A, X% Z/ _7 g) ~
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
; d" K2 R( A: W2 K8 s" H" g1.1.3、黄聪:搜索引擎工作原理-预处理基础简介6 a0 h8 _ h* M. d: x8 c
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
* }% @% T; u$ G2 O1.1.5、黄聪:搜索引擎工作原理-体系结构
% p( W+ W4 E7 ]. N. b. d2.1、黄聪:页面搜集原理、技术和系统-基础知识
% L8 \, {5 \! G+ v+ G [2.2、黄聪:页面搜集原理、技术和系统-搜集过程
( r2 C& N Q( C% u4 i2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义% ^5 [2 Y* s0 t' {" L
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
1 }% Z% V+ b x# p2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页1 |# b4 K$ ?8 {9 W% {) y
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
) I! D% V/ D; B: x2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略, n! O, I2 \% D4 I
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
" ~. j' S% L( z3.1、黄聪:搜集信息的预处理-系统结构) r2 T* H+ ], w8 R$ i
3.1.1、黄聪:搜集信息的预处理-索引网页库
! s: x3 a h n) ^3.1.2、黄聪:搜集信息的预处理-中文分词技术
7 Z6 k3 p* k. m/ B+ x# p3 M* t+ C3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
3 u8 J2 P+ X) h8 w* w/ j2 A8 q3.2、黄聪:搜集信息的预处理-网页净化和消重& y" {9 \) [; _9 [% w
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
" Y2 g# F2 N7 Q9 c5 r3.2.2、黄聪:搜集信息的预处理-网页消重
9 _8 V0 j& R J- s4.1、黄聪:搜集引擎信息查询服务-网页信息检索
- T: T+ D0 s4 l# V& s1 U" S4.2、黄聪:搜集引擎信息查询服务-中文自动摘要4 \% b* T- w, X
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
' E. H6 @; f. C4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
9 Z4 d7 Q4 D( ]' q5.1、黄聪:用户行为分析-用户查询与点击日志) Q6 w6 |& t! B. ?
5.2、黄聪:用户行为分析-查询日志分析' ^, X) T/ D6 P& J- f2 l& F
5.3、黄聪:用户行为分析-点击日志分析( e# J1 \: l3 B, P( F5 }
6.1、黄聪:相关排序-网页权重的计算
4 J0 L2 S3 T. ?) ?3 n/ X( N6.2、黄聪:相关排序-网页词项权重的计算
1 M' q3 T9 Y; P' k6.3、黄聪:相关排序-链接权值的计算3 `9 ?8 P3 c% e8 Z
6.4、黄聪:相关排序-用户评价权值的计算
. R4 Z, \( P8 I" c" ?/ y6.5、黄聪:相关排序-最终权值的计算 x0 {% G# M [
7、黄聪:中文网页自动分类技术
, K# G3 J/ C" h# o) n8、黄聪:搜索引擎工作原理总结6 c: z3 q; A0 {4 D4 z: K3 r
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
& l" @ _# _4 `( ^1 f1 H! o5 \附2、黄聪:如何搭建TSE搜索引擎8 Z6 z% G( N2 V
附3、黄聪:如何让TSE搜索引擎重新抓取网页. S9 M+ L7 [! x2 h" r
4 Y8 _+ N6 P, U/ x下载地址:https://pan.baidu.com/s/1gPW1h
5 c# u% a! p5 }" V% }% j' P& s% W |
|