个人简介

刘焕勇中国科学院软件研究所,专注金融、情报两大领域,从事事件抽取、事件演化、情感分析、事理(知识)图谱、常识推理、语言资源构建与应用等研发工作。目前发表相关论文2篇、申请发明专利6项、主持研发自然语言处理技术开放平台数地工场、大规模实时事理知识学习系统学迹、全行业因果链查询与溯源项目寻链系统,并在智能金融、智能情报落地中负责实施了多个项目。致力于面向中文处理的基础知识库建设与理论技术开源共享,目前累计对外开放自然语言处理实践项目60余个,在openkg开放知识图谱联盟中开放工业应用知识库9类,主笔数地工场技术类系列文章20余篇。

数据地平线科技算法总监、南京擎盾科技技术顾问

lhy_in_blcu@126.com

https://blog.csdn.net/lhy2014

https://github.com/liuhuanyong

公众号:老刘说NLP

微信:lhy19932011

懂语言者,得天下。得语言资源者,定天下。掌语言逻辑者,游得天下

语言资源知识工程事理逻辑事件推理社会计算

专利论文

2020:一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置,专利.CN112668836A
2020:一种面向风险图谱的关联风险证据高效挖掘与监控装置,专利.2020120592831
2020:一种实体描述推理知识库构建与推理证据量化信息获取装置,专利.2020120591425
2020:刘焕勇等.面向开放文本的逻辑推理知识抽取与事件影响推理探索[J],中国中文信息学报
2019:一种融合多类事理与实体知识的领域事件图谱构建方法和装置,专利.2019110594047
2019:一种因果事件图谱构建方法、系统、装置及存储介质,专利.2018113548703
2018:一种行业文本情感获取方法、装置及存储介质,专利.2018108640292
2017:刘焕勇.语言政策领域知识图谱构建初探[D].北京语言大学,2017
2016:刘焕勇.也说“就”[J],唐山师范学院学报,2016年04期

落地产品

年份-领域 应用场景 产品名称 技术点
2021-金融领域 全行业产业链图谱查询与搜索系统 数地产链:全行业产业链图谱查询与搜索系统 实时系统,风险监控,投资监控,风险预警
2021-通用领域 面向用户自有数据的知识图谱可视化与搜索平台 数地绘谱:知识图谱可视化、搜索与分析工具 实时系统,风险监控,投资监控,风险预警
2021-金融领域 投资机构对所投项目/公司实施的数据、情报风险监控预警 风险云图:重大投后风险管理与监测与预警系统 实时系统,风险监控,投资监控,风险预警
2020-情报领域 为事件情报搜索提供事件关联实体、主题、影响、数据等全息信息 数地搜搜:大规模实时事理实例搜索与分析平台 实时系统,事理应用,事件追踪,事件检索
2020-金融领域 提供面向实体、事件的概念描述、因果逻辑的搜索与知识溯源,产业链、关联数据、标的物等预测与链接 学迹:大规模实时事理学习与搜索系统 实证学习,信息检索、问答搜索,知识推理
2020-情报领域 以开放API的形式,提供信息抽取、语义计算、情感分析等自然语言处理组件 数地工场:面向事件与数据的开放语义平台 信息抽取、舆情分析、语义计算、信息采集等API
2019-金融领域 以事理图谱为数据基础,为投资研究员提供逻辑知识沉淀、知识实证、风险预警等服务 投研云图:事理图谱投研逻辑管理与监测系统 基于事理图谱推荐与管理的智能投研管理与监测
2019-情报领域 为输入的特定事件,提供事件起因和后续结果的搜索与可视化展示 事理图谱Demo:全行业事理图谱查询系统 前因后果模式的搜索展示
2019-情报领域 向社会开放语义知识库、系统平台、语料库等知识图谱资源 事理开放知识图谱资源 知识库数据、知识图谱、开放共享
2018-金融领域 基于开放文本的情感分析与事件分析技术,提供针对特定期货的情感走势监测 融合情感与事件的金融期货监控与预测系统 情感分析、事件预测、舆情监控
2018-金融领域 提供上市公司的知识图谱可视化、查询以及自定义模式推理 Datagravition金融知识图谱处理系统 图谱编辑、图谱构建、图谱可视化、事件驱动

技术随笔

名称
2020-12-16 唐刘之辩:行业知识图谱的schema构建的难点、重点与困惑
2020-07-28 可信知识实证在UGC时代情报应用中的思考与探索
2020-06-23 事件抽取中的“门面技术”:事件名称生成浅谈
2020-06-02 领域情报搜索实践:真实场景下的问答策略与风险分析
2020-04-13 情报领域因果推理智能项目概览:以DAPAR为例
2020-04-07 经验回顾:事理图谱技术的应用探索与实践之路
2020-03-30 “学迹”事理知识系统的定位、应用与不足
2020-03-09 热点的识别与分析、重要性判定与时间线生成
2020-03-02 “新冠战疫”中的NLP身影与事件搜索系统的召唤
2020-02-24 业务型知识库实时学习系统搭建实战
2020-02-17 语义平台、抽象概念图谱、事理图谱的认识与应用
2020-02-10 NLP下的新冠肺炎:抽象概念抽取与疫情影响逻辑挖掘
2020-01-20 抽象图谱:通往认知与推理智能的基石
2020-01-13 领域词汇知识库的类型、可用资源与构建技术漫谈
2020-01-06 语言资源构建技术:中文自然语言处理用语言资源策略

开源项目(68项)

常识推理

项目名称 中文名称 项目分类 更新日期
CommonSchemaKG 开放通用实体与事件schema工程 常识推理 2021/04/27
CognitiveInference 认知图谱及其推理 常识推理 2020/8/30
EventPredictBasedOnEG 基于因果事理的事件预测 常识推理 2019/3/29

系统平台

项目名称 中文名称 项目分类 更新日期
EventKGNELL 实时事理知识库构建系统 系统平台 2020/3/18
LanguageKnowledgeGraph 语言政策领域知识图谱系统 系统平台 2018/3/14
LanguagePlatform 自然语言处理综合平台 系统平台 2018/3/6

知识问答

项目名称 中文名称 项目分类 更新日期
QASystemOnMedicalKG 医疗知识图谱问答 知识问答 2020/8/13
QAonMilitaryKG 武器装备知识图谱问答 知识问答 2020/4/19
ZhidaoChatbot 基于知道数据的机器问答 知识问答 2019/3/29
CrimeKgAssitant 法律罪名预测与机器问答 知识问答 2018/12/15
MusicLyricChatbot 基于es的歌词接龙问答 知识问答 2018/10/15

知识图谱

项目名称 中文名称 项目分类 更新日期
AbstractKnowledgeGraph 抽象上下位知识图谱数据集 知识图谱 2019/8/6
PersonGraphDataSet 人物关系图谱数据集 知识图谱 2021/1/26
CausalCollocation 因果搭配抽取数据集 知识图谱 2019/4/22
ProductKnowledgeGraph 产品知识图谱数据集 知识图谱 2019/4/1

语言资源

项目名称 中文名称 项目分类 更新日期
ChineseDiachronicCorpus 中文历时语料库 语言资源 2021/1/13
ChineseSemanticKB 中文语义知识库数据集 语言资源 2020/7/18
CausalCollocation 百度知道类问答数据集 语言资源 2019/8/6
HistoryHotEventBase 历时热点事件数据集 语言资源 2019/4/22
ChineseNLPCorpus 中文开放语料数据集 语言资源 2018/12/16
ChineseEmbedding 基于word2vec的中文向量数据集 语言资源 2018/12/15
BaikeKnowledgeSchema 百科分类知识库数据集 语言资源 2018/4/25

语言工具

项目名称 中文名称 项目分类 更新日期
ChineseAntiword 中文反义词组件 语言工具 2018/8/26
ChineseCixing 中文字形拆解组件 语言工具 2018/8/26
QueryCorrection 基于HMM的问句纠错 语言工具 2018/5/27
Pinyin2Chinese 基于HMM的拼音转汉字 语言工具 2018/4/24
Word2Vector 基于共现、PCA、CBOW的词向量生成 语言工具 2019/4/22
Pinyin2Chinese 基于HMM的拼音转汉字 语言工具 2018/4/24
HuanNLP 手写的分词、词性标注、依存句法分析组件 语言工具 2018/4/14
WordSegment 基于HMM、最大切分的中文分词 语言工具 2018/3/27
Sentence2Vector 基于CBOW的句子向量生成 语言工具 2018/3/25

信息抽取

项目名称 中文名称 项目分类 更新日期
EventTriplesExtraction 主谓宾事件三元组抽取 信息抽取 2021/1/12
DescriptionKBExtraction 概念描述三元组抽取 信息抽取 2020/7/24
PersonRelationKnowledgeGraph 基于boostrapping的人物关系抽取 信息抽取 2018/12/15
QueryCorrection 基于HMM的问句纠错 信息抽取 2018/5/27
LawCrimeMining 法律条文知识抽取 信息抽取 2018/12/15
MedicalNamedEntityRecognition 医疗命名实体识别 信息抽取 2018/12/15
HyponymyExtraction 基于百科数据的上下位抽取 信息抽取 2018/10/7
TextFeatureExtraction 基于 CHI、DF、 IG、MI的文本特征词提取 信息抽取 2018/4/18
KeyInfoExtraction 基于TFIDF、TextRank的关键词、摘要提取 信息抽取 2018/4/17
WordCollocation 基于MI的词语搭配抽取 信息抽取 2018/4/5
BaikeInfoExtraction 面向百科的半结构化信息抽取 信息抽取 2018/3/30

信息采集

项目名称 中文名称 项目分类 更新日期
WeiboIndexSpyder 微博指数采集 信息采集 2018/5/29
AliIndexSpyder 阿里商品指数采集 信息采集 2018/8/26
QueryCorrection 基于HMM的问句矫正 信息采集 2018/5/29
BaiduIndexSpyder 百度指数采集 信息采集 2018/5/27
SougouWordsCollector 基于搜狗输入法的领域词收集 信息采集 2018/4/25

文本生成

项目名称 中文名称 项目分类 更新日期
Seq2seqAttGeneration 序列到序列加注意力机制的文本生成 文本生成 2021/1/11
Seq2seqGeneration 序列到序列的文本生成 文本生成 2021/1/6
Seq2SeqTranslation 基于seq2seq的中英翻译 文本生成 2018/5/27

文本计算

项目名称 中文名称 项目分类 更新日期
SiameseSentenceSimilarity 基于孪生网络的句子相似度计算 文本计算 2019/12/5
IdealWordCloudKit 自定义词云可视化 文本计算 2019/1/26
EventMonitor 基于搜索引擎的事件监测 文本计算 2018/12/15
SentenceSimilarity 基于规则与向量化的句子相似度计算 文本计算 2018/12/15
ChineseTextualInference 中文文本蕴含推断 文本计算 2018/12/15
WordMultiSenseDisambiguation 基于百科的词语消歧 文本计算 2018/12/15
TopicCluster 基于lda与k-means的话题聚类 文本计算 2018/12/15
ImportantEventExtractor 事件重要性判定与时间线生成 文本计算 2018/10/7
PoemMining 基于诗歌数据的诗人足迹挖掘 文本计算 2018/10/7
TextGrapher 基于关键信息的文本图谱化 文本计算 2018/10/6

事理抽取

项目名称 中文名称 项目分类 更新日期
SequentialEventExtration 基于游记的顺承事件抽取 事理抽取 2018/12/15
CausalityEventExtraction 基于规则的因果事件抽取 事理抽取 2018/12/15
ComplexEventExtraction 基于规则的复合事件抽取 事理抽取 2018/12/15

情感计算

项目名称 中文名称 项目分类 更新日期
DocSentimentAnalysis 篇章级情感分析 情感计算 2019/6/11
ChineseHumorSentiment 中文幽默情感计算 情感计算 2018/12/15
ZhuguanDetection 基于规则的主观性计算 情感计算 2018/10/6
SentimentWordExpansion 基于SO-PMI的情感词扩展 情感计算 2018/4/5
SentenceSentimentClassifier 基于MLP, CNN, RNN的情感分类 情感计算 2018/3/24

报告分享

项目名称 中文名称 项目分类 更新日期
PersonalModernPoems 个人现代诗创作 报告分享 2018/12/23
KnowledgeGraphSlides 知识图谱报告数据集 报告分享 2018/12/15
CCL2018Summary CCL2018参会总结 报告分享 2018/10/24
CCKS2018Summary CCKS2018参会总结 报告分享 2018/10/7