您当前的位置：首页 > .net

K风asp.net网页搜索引擎系统 v2.2 SP5

2021-01-21 17:19:42 35资源网(www.35d.net)

下载本资源原文网址：http://www.daima.org/net/net4430.html

K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统，拥有先进的智能分析和海量数据检索技术，核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构，支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品，为用户提供海量数据全文检索应用的理想解决方案。
K风网页搜索V2.2版本主要改进：改进索引系统读写性能，提高约10倍的索引速度；
SP5：修正改进搜索算法；
SP4：修正、优化部分核心程序；
SP3：优化检索流程、修复程序错误；
SP2改进：修正检索组件错误引起的检索速度慢问题，大大提高检索速度；
SP1改进：增加哈希值长度，基本能达到100%采集，全面爬行整站网页、增加搜索风云榜功能；
K风网页搜索V2.1版本主要改进：使用.NET技术开发Web前台程序、采用UTF-8网页编码、全新索引系统、开放管理工具源代码；SP1改进：修正自动识别网页编码、改进哈希使蜘蛛爬行更全面、修正特殊情况出现的入库错误等；
K风网页搜索功能特点
多线程网络蜘蛛
网页定向采集
多语言网页编码自动识别
哈希表网页去重
智能网页正文抽取
基于词库的智能中文分词
中文分词词库管理
海量数据毫秒级全文检索
缓存技术
网页快照
高级搜索
竞价排名
网络蜘蛛
网络蜘蛛采用多线程并发采集网页，结合高效的采集机制和策略部署，最大限度提高网页采集的效率。支持网页定向采集，垂直搜索引擎提高数据质量和相关度的关键技术，用户可以自定义采集规则针对特定网页进行采集。支持多种动态和静态网页类型采集，多语言网页编码自动识别。采用哈希表网页去重技术，具有高性能、低系统占用的特点，使网络蜘蛛高效稳定运行。支持单个或批量网站采集、自动采集、自动更新功能。
正文抽取
智能网页正文抽取技术，它的作用是把一个网页的主题中心内容抽取并把与该网页主题无关的信息（广告、导航、版权等非网页正文内容信息）过滤。这项技术有效提高网页信息采集的质量和检索相关度，智能自动识别、准确网页正文抽取，准确率达到95%以上。
中文分词
基于词库的智能中文分词技术，支持中英文切分、中文简繁字体转换、全角半角转换、中文姓名识别等多项智能分析技术。用户可以根据自己的应用需要扩充和维护词库，以达到最佳的分词效果。
全文检索
采用海量数据索引系统架构和先进的全文检索算法技术，结合高效的检索优化策略，支持海量数据毫秒级检索速度和多用户并发检索。高级搜索支持自定义检索方式，满足用户不同的检索需求。采用高效的缓存技术策略提高系统的稳定性和负载能力、减轻系统负担，缓存数据根据特定的条件自动更新。
适用对象
适用于企业、政府机构、学校等内部网站群组或Internet网站群组建立网页搜索引擎；
适用于各行各业领域网站群组建立行业网页搜索引擎；
适用于省、市、区等地方网站群组建立地方网页搜索引擎；

下载地址：	[ 下载地址1 ] 消耗积分:0分 [ 下载地址2 ] 消耗积分:0分 [ 下载地址3 ] 消耗积分:0分
网盘密码	（密码：）

doreesoft asp.net多瑞外贸网店系统 v2.0.1

asp.net 星空成绩管理系统 v1.05

赞助

相关代码

无相关信息

最新代码

栏目热门

Tags: 微信小程序源码源码下载 HTML5游戏 92Game 整站源码 PHP 商业版帝国CMS cms 完整版网站源码织梦模板织梦 wordpress插件下载最新 html5源码微信小程序源码帝国CMS内核带后台微信公众号 DEDECMS HTML5 完整源码微信自动采集完整版源码 ecshop 源代码 Thinkphp dede织梦模板 PHP+MYSQL 小程序小程序源码 DESTOON6.0 搜客淘宝客淘宝客更新包合集带手机版整站手机版完整运营版游戏 92 92kaifa 完整商业版源码管理系统 dedecms模板织梦CMS内核带数据电影网站系统多城市生成静态免费下载一键安装版系统源码多多淘宝客同步包

资源大全_资源下载网站：www.35d.net 本站资源仅限研究学习使用，如需商用请联系版权方，本站事务联系QQ：939804642