个人简介

刘焕勇,专注基于自然语言处理的应用落地,从事垂域事理(知识)图谱构建、知识表示与图算法应用、语言资源构建等研发工作。目前发表相关论文2篇、申请发明专利6项、主持研发自然语言处理技术开放平台、大规模实时事理知识学习系统学迹等,并在智能金融、智能情报落地中负责实施了多个项目。致力于面向中文处理的基础知识库建设与理论技术开源共享,目前累计对外开放自然语言处理实践项目60余个,在openkg开放知识图谱联盟中开放工业应用知识库9类,致力于公众号老刘说NLP技术分享。

现任:360人工智能研究院算法专家(负责知识融合治理、知识表示与图算法、垂域知识图谱构建与应用方向)

曾任:中国科学院软件研究所算法工程师(负责面向金融与情报领域的知识图谱、事理图谱构建与应用研发)

lhy_in_blcu@126.com

https://blog.csdn.net/lhy2014

https://github.com/liuhuanyong

公众号:老刘说NLP

懂语言者,得天下。得语言资源者,定天下。掌语言逻辑者,游得天下

语言资源知识工程事理逻辑事件推理社会计算



技术思考(更新)

名称
2021-11-11 知识图谱入门:知识图谱构建中的实体识别常用范式、关键问题与应对措施总结
2021-11-10 知识图谱入门:知识图谱构建中的本体设计、关键流程与开源本体工具总结
2021-11-08 知识图谱入门:知识图谱存储、融合、可视化、图表示计算与搜索常用工具总结
2021-11-07 知识图谱入门:图谱构建中的数据采集、文本解析处理、数据分析常用工具总结
2021-11-09 情报技术:美国DARPA主导的智能化情报分析系列项目概览
2021-11-06 技术思考:面向落地应用的事件类图谱划分、关键问题及其与知识图谱的对比辨析
2021-11-05 技术思考:一片繁荣与满地鸡毛的知识图谱技术落地冷辨析
2021-11-04 万字长文:预训练词向量模型的方法、应用场景、变体延伸与实践总结
2021-11-03 技术实践:分类与NER场景中的数据增强方法、实例效果、开源工具与经验总结
2021-11-01 经验分享:基于BERT-BiLSTM-CRF的实体描述知识抽取建模实战
2021-10-29 经验分享:知识图谱可视化场景中的常见形态、关键问题与开源工具总结
2021-10-26 重磅开源:面向上市公司的十万级产业链图谱构建思路与数据开放
2021-10-24 技术总结:NLP中的模式匹配落地场景及高效开源工具总结与分析
2021-10-17 数据资源:事件图谱构建中常用事件抽取、因果事件关系数据集的总结与思考
2021-10-16 数据资源:常用12类实体识别、10类关系抽取数据集的梳理与思考
2021-10-05 技术总结:业务落地场景中的大规模向量化表示与开源检索工具概述
2021-09-21 技术总结:图算法的应用场景、基本理论、开源工具概述
2021-09-20 技术思考:也谈知识图谱平台中的数据流程与构建范式思考
2021-09-19 老刘说NLP:诗歌生成下也忆那年的蹩脚诗集
2021-09-12 老刘说NLP:焦虑被大肆贩卖下的自然语言处理学习思考
2021-08-29 万字长文:近年来学界、业界视角下的“事理图谱”发展总结与思考
2021-08-22 关于知识图谱标准化构建平台的思考:知识图谱只能做项目,不能做平台?
2021-08-22 老刘说NLP,说说老刘这几年(关于NLP、知识图谱、事理图谱的思考)
2020-12-16 唐刘之辩:行业知识图谱的schema构建的难点、重点与困惑
2020-07-28 可信知识实证在UGC时代情报应用中的思考与探索
2020-06-23 事件抽取中的“门面技术”:事件名称生成浅谈
2020-06-02 领域情报搜索实践:真实场景下的问答策略与风险分析
2020-04-13 情报领域因果推理智能项目概览:以DAPAR为例
2020-04-07 经验回顾:事理图谱技术的应用探索与实践之路
2020-03-30 “学迹”事理知识系统的定位、应用与不足
2020-03-09 热点的识别与分析、重要性判定与时间线生成
2020-03-02 “新冠战疫”中的NLP身影与事件搜索系统的召唤
2020-02-24 业务型知识库实时学习系统搭建实战
2020-02-17 语义平台、抽象概念图谱、事理图谱的认识与应用
2020-02-10 NLP下的新冠肺炎:抽象概念抽取与疫情影响逻辑挖掘
2020-01-20 抽象图谱:通往认知与推理智能的基石
2020-01-13 领域词汇知识库的类型、可用资源与构建技术漫谈
2020-01-06 语言资源构建技术:中文自然语言处理用语言资源策略

专利论文

2020:一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置,专利.CN112668836A
2020:一种面向风险图谱的关联风险证据高效挖掘与监控装置,专利.2020120592831
2020:一种实体描述推理知识库构建与推理证据量化信息获取装置,专利.2020120591425
2020:刘焕勇等.面向开放文本的逻辑推理知识抽取与事件影响推理探索[J],中国中文信息学报
2019:一种融合多类事理与实体知识的领域事件图谱构建方法和装置,专利.2019110594047
2019:一种因果事件图谱构建方法、系统、装置及存储介质,专利.2018113548703
2018:一种行业文本情感获取方法、装置及存储介质,专利.2018108640292
2017:刘焕勇.语言政策领域知识图谱构建初探[D].北京语言大学,2017
2016:刘焕勇.也说“就”[J],唐山师范学院学报,2016年04期

开源项目(68项)

常识推理

项目名称 中文名称 项目分类 更新日期
CommonSchemaKG 开放通用实体与事件schema工程 常识推理 2021/04/27
CognitiveInference 认知图谱及其推理 常识推理 2020/8/30
EventPredictBasedOnEG 基于因果事理的事件预测 常识推理 2019/3/29

系统平台

项目名称 中文名称 项目分类 更新日期
EventKGNELL 实时事理知识库构建系统 系统平台 2020/3/18
LanguageKnowledgeGraph 语言政策领域知识图谱系统 系统平台 2018/3/14
LanguagePlatform 自然语言处理综合平台 系统平台 2018/3/6

知识问答

项目名称 中文名称 项目分类 更新日期
QASystemOnMedicalKG 医疗知识图谱问答 知识问答 2020/8/13
QAonMilitaryKG 武器装备知识图谱问答 知识问答 2020/4/19
ZhidaoChatbot 基于知道数据的机器问答 知识问答 2019/3/29
CrimeKgAssitant 法律罪名预测与机器问答 知识问答 2018/12/15
MusicLyricChatbot 基于es的歌词接龙问答 知识问答 2018/10/15

知识图谱

项目名称 中文名称 项目分类 更新日期
AbstractKnowledgeGraph 抽象上下位知识图谱数据集 知识图谱 2019/8/6
PersonGraphDataSet 人物关系图谱数据集 知识图谱 2021/1/26
CausalCollocation 因果搭配抽取数据集 知识图谱 2019/4/22
ProductKnowledgeGraph 产品知识图谱数据集 知识图谱 2019/4/1

语言资源

项目名称 中文名称 项目分类 更新日期
DomainWordsDict 领域特征词汇知识库 语言资源 2021/8/28
ChineseDiachronicCorpus 中文历时语料库 语言资源 2021/1/13
ChineseSemanticKB 中文语义知识库数据集 语言资源 2020/7/18
CausalCollocation 百度知道类问答数据集 语言资源 2019/8/6
HistoryHotEventBase 历时热点事件数据集 语言资源 2019/4/22
ChineseNLPCorpus 中文开放语料数据集 语言资源 2018/12/16
ChineseEmbedding 基于word2vec的中文向量数据集 语言资源 2018/12/15
BaikeKnowledgeSchema 百科分类知识库数据集 语言资源 2018/4/25

语言工具

项目名称 中文名称 项目分类 更新日期
ChineseAntiword 中文反义词组件 语言工具 2018/8/26
ChineseCixing 中文字形拆解组件 语言工具 2018/8/26
QueryCorrection 基于HMM的问句纠错 语言工具 2018/5/27
Pinyin2Chinese 基于HMM的拼音转汉字 语言工具 2018/4/24
Word2Vector 基于共现、PCA、CBOW的词向量生成 语言工具 2019/4/22
Pinyin2Chinese 基于HMM的拼音转汉字 语言工具 2018/4/24
HuanNLP 手写的分词、词性标注、依存句法分析组件 语言工具 2018/4/14
WordSegment 基于HMM、最大切分的中文分词 语言工具 2018/3/27
Sentence2Vector 基于CBOW的句子向量生成 语言工具 2018/3/25

信息抽取

项目名称 中文名称 项目分类 更新日期
EventTriplesExtraction 主谓宾事件三元组抽取 信息抽取 2021/1/12
DescriptionKBExtraction 概念描述三元组抽取 信息抽取 2020/7/24
PersonRelationKnowledgeGraph 基于boostrapping的人物关系抽取 信息抽取 2018/12/15
QueryCorrection 基于HMM的问句纠错 信息抽取 2018/5/27
LawCrimeMining 法律条文知识抽取 信息抽取 2018/12/15
MedicalNamedEntityRecognition 医疗命名实体识别 信息抽取 2018/12/15
HyponymyExtraction 基于百科数据的上下位抽取 信息抽取 2018/10/7
TextFeatureExtraction 基于 CHI、DF、 IG、MI的文本特征词提取 信息抽取 2018/4/18
KeyInfoExtraction 基于TFIDF、TextRank的关键词、摘要提取 信息抽取 2018/4/17
WordCollocation 基于MI的词语搭配抽取 信息抽取 2018/4/5
BaikeInfoExtraction 面向百科的半结构化信息抽取 信息抽取 2018/3/30

信息采集

项目名称 中文名称 项目分类 更新日期
WeiboIndexSpyder 微博指数采集 信息采集 2018/5/29
AliIndexSpyder 阿里商品指数采集 信息采集 2018/8/26
QueryCorrection 基于HMM的问句矫正 信息采集 2018/5/29
BaiduIndexSpyder 百度指数采集 信息采集 2018/5/27
SougouWordsCollector 基于搜狗输入法的领域词收集 信息采集 2018/4/25

文本生成

项目名称 中文名称 项目分类 更新日期
Seq2seqAttGeneration 序列到序列加注意力机制的文本生成 文本生成 2021/1/11
Seq2seqGeneration 序列到序列的文本生成 文本生成 2021/1/6
Seq2SeqTranslation 基于seq2seq的中英翻译 文本生成 2018/5/27

文本计算

项目名称 中文名称 项目分类 更新日期
SinglepassTextCluster 基于Singlepass的增量快速文本聚类 文本计算 2021/09/04
SiameseSentenceSimilarity 基于孪生网络的句子相似度计算 文本计算 2019/12/5
IdealWordCloudKit 自定义词云可视化 文本计算 2019/1/26
EventMonitor 基于搜索引擎的事件监测 文本计算 2018/12/15
SentenceSimilarity 基于规则与向量化的句子相似度计算 文本计算 2018/12/15
ChineseTextualInference 中文文本蕴含推断 文本计算 2018/12/15
WordMultiSenseDisambiguation 基于百科的词语消歧 文本计算 2018/12/15
TopicCluster 基于lda与k-means的话题聚类 文本计算 2018/12/15
ImportantEventExtractor 事件重要性判定与时间线生成 文本计算 2018/10/7
PoemMining 基于诗歌数据的诗人足迹挖掘 文本计算 2018/10/7
TextGrapher 基于关键信息的文本图谱化 文本计算 2018/10/6

事理抽取

项目名称 中文名称 项目分类 更新日期
SequentialEventExtration 基于游记的顺承事件抽取 事理抽取 2018/12/15
CausalityEventExtraction 基于规则的因果事件抽取 事理抽取 2018/12/15
ComplexEventExtraction 基于规则的复合事件抽取 事理抽取 2018/12/15

情感计算

项目名称 中文名称 项目分类 更新日期
DocSentimentAnalysis 篇章级情感分析 情感计算 2019/6/11
ChineseHumorSentiment 中文幽默情感计算 情感计算 2018/12/15
ZhuguanDetection 基于规则的主观性计算 情感计算 2018/10/6
SentimentWordExpansion 基于SO-PMI的情感词扩展 情感计算 2018/4/5
SentenceSentimentClassifier 基于MLP, CNN, RNN的情感分类 情感计算 2018/3/24

报告分享

项目名称 中文名称 项目分类 更新日期
PersonalModernPoems 个人现代诗创作 报告分享 2018/12/23
KnowledgeGraphSlides 知识图谱报告数据集 报告分享 2018/12/15
CCL2018Summary CCL2018参会总结 报告分享 2018/10/24
CCKS2018Summary CCKS2018参会总结 报告分享 2018/10/7