K风网页搜索引擎系统 2.2 SP5
源码类别: 搜索查询 文件大小: 2952 K K风网页搜索引擎系统 2.2 SP5 演示图
运行环境: .NET/SQL 源码语言: 简体中文
源码作者: 凯之风 下载次数: 4369
更新日期: 2011-11-28 15:53:15 授权形式: 免费版
相关链接: 官方网站   演示网址 源码评级:
源码简介 相关最新源码
K风是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。

K风网页搜索引擎系统 2.2 SP5 版本主要改进:
2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度;
SP5:修正改进搜索算法;
SP4:修正、优化部分核心程序;
SP3:优化检索流程、修复程序错误;
SP2改进:修正检索组件错误引起的检索速度慢问题,大大提高检索速度;
SP1改进:增加哈希值长度,基本能达到100%采集,全面爬行整站网页、增加搜索风云榜功能;;

功能特点:
多线程网络蜘蛛
网页定向采集
多语言网页编码自动识别
哈希表网页去重
智能网页正文抽取
基于词库的智能中文分词
中文分词词库管理
海量数据毫秒级全文检索
缓存技术
网页快照
高级搜索
竞价排名
网络蜘蛛

网络蜘蛛采用多线程并发采集网页,结合高效的采集机制和策略部署,最大限度提高网页采集的效率。支持网页定向采集,垂直搜索引擎提高数据质量和相关度的关键技术,用户可以自定义采集规则针对特定网页进行采集。支持多种动态和静态网页类型采集,多语言网页编码自动识别。采用哈希表网页去重技术,具有高性能、低系统占用的特点,使网络蜘蛛高效稳定运行。支持单个或批量网站采集、自动采集、自动更新功能。

正文抽取
智能网页正文抽取技术,它的作用是把一个网页的主题中心内容抽取并把与该网页主题无关的信息(广告、导航、版权等非网页正文内容信息)过滤。这项技术有效提高网页信息采集的质量和检索相关度,智能自动识别、准确网页正文抽取,准确率达到95%以上。

中文分词
基于词库的智能中文分词技术,支持中英文切分、中文简繁字体转换、全角半角转换、中文姓名识别等多项智能分析技术。用户可以根据自己的应用需要扩充和维护词库,以达到最佳的分词效果。

全文检索
采用海量数据索引系统架构和先进的全文检索算法技术,结合高效的检索优化策略,支持海量数据毫秒级检索速度和多用户并发检索。高级搜索支持自定义检索方式,满足用户不同的检索需求。采用高效的缓存技术策略提高系统的稳定性和负载能力、减轻系统负担,缓存数据根据特定的条件自动更新。

适用对象
适用于企业、政府机构、学校等内部网站群组或Internet网站群组建立网页搜索引擎;
适用于各行各业领域网站群组建立行业网页搜索引擎;
适用于省、市、区等地方网站群组建立地方网页搜索引擎;

  • ·搜易站内搜索引擎 6.1
  • ·探索者互联网舆情监测系统 2.0.2
  • ·招聘网站实时信息综合查询
  • ·在线密码生成器(Cipher Maker) 1.0
  • ·小型计算器网页版
  • ·农历阳历在线互相转换 1.0
  • ·百度云网盘搜索工具
  • ·WinForm天气预报 1.0
  • ·C#生辰八字生成工具 1.0
  • ·龙威电子证书管理系统 1.3.1
  •                        详细介绍  
    源码下载地址
    K风网页搜索引擎系统 2.2 SP5 [ 天津亿人互联 ]
    K风网页搜索引擎系统 2.2 SP5 [ 浙江电信下载 ]
    K风网页搜索引擎系统 2.2 SP5 [ 安徽电信下载 ]

    广告推荐

    .NET搜索查询源码下载排行