|
1.1.1、黄聪:搜索引擎的工作原理-基础要求! y" ]* i7 A' |( a M% i7 w+ k
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介5 |; }9 m P. j3 g" c0 B- e& T
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介) _( H$ x# M9 K2 e2 C$ g" R
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
7 f. C8 Z, g6 h% k0 s0 V: v1.1.5、黄聪:搜索引擎工作原理-体系结构1 W& l: C- l3 w2 a# e2 c
2.1、黄聪:页面搜集原理、技术和系统-基础知识
7 f* p) f4 J2 w2 G( E2.2、黄聪:页面搜集原理、技术和系统-搜集过程+ J$ p9 g. A! t! X! ?+ c2 Z# D8 U
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
& a$ t$ d) o2 x/ t, c% n2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集7 C0 V; S1 e/ b2 y6 z' Y1 J$ w
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
5 q. Z8 V0 m+ b& N; q' q2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统$ W- R" I4 |; y) t* L. ~% }* ?
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
( T; m. g i" {4 d2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计% V9 J( G7 N9 S' x
3.1、黄聪:搜集信息的预处理-系统结构6 I; W2 b: G. r
3.1.1、黄聪:搜集信息的预处理-索引网页库
4 q) s8 H5 ^" X% j3.1.2、黄聪:搜集信息的预处理-中文分词技术6 l7 y( l3 R7 p; q) [% C) j9 ] D; l
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
/ f9 a! `( D Z3.2、黄聪:搜集信息的预处理-网页净化和消重" e B6 T. U0 H& [# G
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
) w8 z6 m% F5 _, E5 ~/ o3.2.2、黄聪:搜集信息的预处理-网页消重+ o2 A0 U* g: k1 n4 j
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
2 E- w1 g- K# O; h7 C; v; i" {$ ?4.2、黄聪:搜集引擎信息查询服务-中文自动摘要" }5 u: o7 v1 v" [4 c- D+ o( _+ n
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
! N0 p! ~& R9 `4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存1 n; B. `+ }2 l( ]; H
5.1、黄聪:用户行为分析-用户查询与点击日志' |4 a- b; O9 x) S
5.2、黄聪:用户行为分析-查询日志分析
0 D8 K5 H: L- [& h7 T# F5.3、黄聪:用户行为分析-点击日志分析( a& _2 {% g) b6 V8 F
6.1、黄聪:相关排序-网页权重的计算
9 \0 [; F/ }; U& T" n6.2、黄聪:相关排序-网页词项权重的计算
- T+ I' S% d8 d8 c6 k2 ^( R: K7 |6.3、黄聪:相关排序-链接权值的计算* B1 B$ O2 }, U& [& e5 C/ p+ j0 C
6.4、黄聪:相关排序-用户评价权值的计算
8 K" K* o5 q- m: ~6.5、黄聪:相关排序-最终权值的计算
( ~1 y# E% f- [, \$ ]1 w" m* S7、黄聪:中文网页自动分类技术
- o+ X$ D3 ~3 |- p# I' Z2 Y8、黄聪:搜索引擎工作原理总结
1 x8 w% F) d0 Y$ O1 I8 `3 s附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu+ R8 M2 c1 [! E
附2、黄聪:如何搭建TSE搜索引擎
5 C( S) |) k2 A7 A- h$ I附3、黄聪:如何让TSE搜索引擎重新抓取网页
" [& b- T! e8 S$ O X
+ ~ S, Q( O; k$ M0 l8 L( z' e! z* \下载地址:https://pan.baidu.com/s/1gPW1h
; z7 _5 s5 Q0 t- y4 Q# ^ |
|