设为首页收藏本站

绿色BI论坛商业智能大数据交流社区

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 111|回复: 0

NlpirParser灵玖智能挖掘平台精准搜索引擎

[复制链接]
发表于 2017-6-5 14:41:00 | 显示全部楼层 |阅读模式
  NlpirParser智能挖掘平台精准搜索引擎是灵玖软件联合中科院与北理工的信息检索专家,针对大数据搜索业务需求而打造的一套搜索引擎,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持邻近搜索、负面搜索、语义关联搜索,可提供各类数据库的实时搜索服务,并支持少数民族语言。
电力大数据解决方案.png
  NlpirParser灵玖智能挖掘平台精准搜索引擎的系统架构:
  整个系统包括六个部分:其中核心组件有索引器Indexer,搜索器Searcher;内部配套的词法分析工具ICTCLAS,搜索管理器Manager;以及外围组件有数据库适配器Adapter,供开发人员调用的SaaS API。依次介绍如下:
  1. Inderxer(索引器)
  主要功能是对各类结构化与非结构化数据进行高效索引,索引文件以索引桶的形式存储。
  2. Searcher(搜索器)
  主要功能是对用户查询进行解析,并搜索所有的索引桶,按照排序算法要求输出各类形式的查询结果,最终返回给搜索用户。
  3. ICTCLAS(词法分析工具)
  主要功能是对用户查询与文档进行词法分析,提供分词结果供后续的计算提供词法粒度,可以解决汉语与英语的编码转换与词法处理工作。少数民族语言搜索的词法分析采用n-gram进行索引。
  4. Manager(搜索管理器)
  主要功能是为管理员提供精准搜索引擎的后台知识与索引文件提供管理工具,搜索管理器采用命令行、可视化界面及API的形式,实现同义与相关词扩展、索引自动归并、部分索引内容的删除、索引项自动统计等功能。
  5. Adapter(数据库适配器)
  主要功能是自动对已有的数据库进行扫描遍历,实现对数据库的无缝支持,从而为数据库管理系统提供全文搜索功能,目前支持的数据库系统包括:Oracle, SQL Server, MySQL以及新型的HBase, MongoDB等数据库。从而为各类业务系统提供结构化与非结构化数据的联合搜索服务。
  6. SaaS API(供开发人员调用的精准搜索引擎服务API)
  NlpirParser灵玖智能挖掘平台精准搜索引擎可以自动搭建,针对已有的业务数据提供无值守的搜索服务。开发人员只要熟悉搜索语法,采用SaaS API即可使用搜索服务,嵌入自己的应用程序,实现大数据的精准搜索。
  NlpirParser灵玖智能挖掘平台精准搜索引擎提供的是在线增量索引功能,即:整个搜索服务不间断的情况下,实现增量索引,索引完成后,自动加载增量数据;如果索引桶碎片过多,则自动对索引桶进行归并操作。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

手机版|使用帮助|绿色BI论坛商业智能大数据交流社区 ( 粤ICP备09215901号-2   

点击这里给我发消息

粤公网安备 44049102496016号

GMT+8, 2017-6-27 16:52 , Processed in 1.466403 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表