设为首页收藏本站

绿色BI论坛商业智能大数据交流社区

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 134|回复: 0

灵玖Nlpir Parser用人工神经网络技术提到文本处理

[复制链接]
发表于 2017-8-15 14:54:18 | 显示全部楼层 |阅读模式
  人工神经网络是,由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。人工神经网络具有四个基本特征:
  (1)非线性:非线性关系是自然界的普遍特性。大脑的智慧就是一种非线性现象。人工神经元处于激活或抑制二种不同的状态,这种行为在数学上表现为一种非线性
  关系。具有阈值的神经元构成的网络具有更好的性能,可以提高容错性和存储容量。
  (2)非局限性: 一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子。
  (3)非常定性: 人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程。
  (4)非凸性: 一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。例如能量函数,它的极值相应于系统比较稳定的状态。非凸性是指这种函数有多个极值,故系统具有多个较稳定的平衡态,这将导致系统演化的多样性。
灵玖软件大数据语义分词.jpg
  NLPIR Parser 大数据搜索与挖掘共享开发平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。通过人工神经网络技术使NLPIR Parser具有智能、高效、自学习的能力,并实现系统一下智能功能:
  1. JZSearch 全文精准检索:支持文本、数字、日期、字符串等各种数据类型,多字段的快捷搜索,支持 AND/OR/NOT 以及 NEAR 邻近等查询语法,支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。
  2. 新词发现:从文件集合中挖掘出内涵的新词语列表,可以用于用户专业词典的编撰;还可以进一步编辑标注,导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化。
  3. 大数据聚类及热点分析:能够从大规模数据中自动分析出热点事件,并提供事件话题的关键特征描述。同时适用于长文本和短信、微博等短文本的热点分析。
  4. 大数据分类过滤:针对事先制定的规则和示例样本,系统自动从海量文档中筛选出符合需求的样本。
  5. 自动摘要与关键词提取:能够对单篇或多篇文章,自动提炼出内容的精华,方便用户快速浏览文本内容。能够对单篇文章或文章集合,提取出若干个代表文章中心思想的词汇或短语,可用于精化阅读、语义查询和快速匹配等。
  6.敏感关键词实时智能扫描:可根据实时智能识别关键词音变、形变与拆字等常见变体,并实现了语义的精准排歧,系统内置了国内很全的知识库,适用于各种不良内容的智能过滤发现。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

手机版|使用帮助|绿色BI论坛商业智能大数据交流社区 ( 粤ICP备09215901号-2   

点击这里给我发消息

粤公网安备 44049102496016号

GMT+8, 2017-11-22 01:37 , Processed in 1.232402 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表