项目简介
针对目前图神经网络(GNN)结合知识图谱(Knowledge Graph)在反诈研究上仍较少的现状,本开源项目在技术研究基础上,通过网络爬虫进行对象探测、数据收集、数据处理;利用jieba分词进行实体识别;使用py2neo库构建知识图谱;用neo4j图数据库存储知识图谱;运用 mindspore 构建图神经网络模型对知识图谱进行补全与推理。最后还提出了反诈骗小程序的设计方案。
项目设计
聚焦爬虫
聚焦爬虫流程图
实体识别
实体识别流程图
知识图谱构建
知识图谱构建示意图
知识图谱推理
知识推理流程图
爬虫使用
文章爬取
爬取的文章部分展示
数据清洗
数据清洗后展示
Neo4j 图数据库使用
Neo4j 简介
Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。
Neo4j安装
Neo4j官网:
https://neo4j.com/
Neo4j使用
mindspore图神经网络使用
代码简介
安装环境
pip install -r requirements.txt
使用
python Main.py
结果图
程序结果图
打开neo4j输入如下指令
MATCH (n) RETURN n LIMIT 100
知识图谱结果
打开neo4j输入如下指令
UNWIND ['0', '1'] AS label
MATCH (n {label: label})
CALL apoc.create.vNode([label], {content:n.content}) YIELD node AS vPerson
RETURN vPerson
二分类结果
管理仓库
从命令行创建一个新的仓库
touch README.md
git init
git add README.md
git commit -m "first commit"
git remote add origin https://www.gitlink.org.cn/tmlwacre/fraudKG.git
git push -u origin master
从命令行推送已经创建的仓库
git remote add origin https://www.gitlink.org.cn/tmlwacre/fraudKG.git
git push -u origin master
文件说明
MindSpore知识图谱图神经网络
里面包含测试数据、数据预处理文件、构建知识图谱代码、MindSpore图神经网络代码、测试代码。
爬虫
里面包含用于爬取网页数据的爬虫代码。
微信小程序
里面包含现有微信小程序的代码。
小程序设计图
里面包含未来微信小程序的设计图。
诈骗案例数据集
里面包含爬虫收集的各个平台的完整数据
项目简介
针对目前图神经网络(GNN)结合知识图谱(Knowledge Graph)在反诈研究上仍较少的现状,本开源项目在技术研究基础上,通过网络爬虫进行对象探测、数据收集、数据处理;利用jieba分词进行实体识别;使用py2neo库构建知识图谱;用neo4j图数据库存储知识图谱;运用 mindspore 构建图神经网络模型对知识图谱进行补全与推理。最后还提出了反诈骗小程序的设计方案。
项目设计
聚焦爬虫
实体识别
知识图谱构建
知识图谱推理
爬虫使用
文章爬取
数据清洗
Neo4j 图数据库使用
Neo4j 简介
Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。
Neo4j安装
Neo4j官网:
https://neo4j.com/
Neo4j使用
mindspore图神经网络使用
代码简介
安装环境
使用
结果图
打开neo4j输入如下指令
打开neo4j输入如下指令
管理仓库
从命令行创建一个新的仓库
从命令行推送已经创建的仓库
文件说明
MindSpore知识图谱图神经网络
里面包含测试数据、数据预处理文件、构建知识图谱代码、MindSpore图神经网络代码、测试代码。
爬虫
里面包含用于爬取网页数据的爬虫代码。
微信小程序
里面包含现有微信小程序的代码。
小程序设计图
里面包含未来微信小程序的设计图。
诈骗案例数据集
里面包含爬虫收集的各个平台的完整数据