2021SC@SDUSC
目录
课题简介
人员分工
环境配置
一、Python安装
二、CUDA和cuDNN安装
三、深度学习框架安装
四、环境验证
源码下载
课题简介
我们的研究课题是《知识图到文本的生成》(原文:《Text Generation from Knowledge Graphs with Graph Transformers》)。
文章提出了一个新的图转换编码器,它可以利用这些知识图谱的关系结构,而不需要施加线性化或层次约束。结合编解码器的设置,提供一个端到端可训练的系统,用于生成应用于科学文本领域的图形到文本的生成,该编码器成功地将序列变换器应用于图结构化的输入。文章展示了IE输出如何形成为一个连接的、未标记的图形,以用于基于注意力的编码器。文章提供了与科学为本匹配的大的知识图谱数据集,以用于未来的研究。
人员分工
在阅读论文后,我们小组进行了课题讨论。讨论中大家一起总结了论文中的算法实现过程,然后根据我们对论文的理解,初步进行了代码分析的分工。论文大致包括了训练、生成、实验评估的应用流程,这个算法包含了一份数据集和6个.py的文件,代码流程大致为数据预处理、编码器、解码器、实验评估。我们小组成员浏览完代码后作出了初步的分工决定。后面我将分析generator.py、lastDataset.py、pargs.py中的核心代码与关键代码,即应用流程中的生成过程。
环境配置
目前所有的编程语言中, Python是最适合进行深度学习代码编程的语言。CUDA 这个并行计算运算平台,可以充分发挥 CPU 和 GPU 的性能,于是需要安装CUDA和cuDNN。最后是深度学习框架的选择。深度学习框架有很多,主流的两个深度学习框架,一是 Tensorflow,二是 Pytorch,在这我们选择的是Pytorch。以下是详细内容。
一、Python安装
进入python官网选择合适的版本进行下载和安装,安装时注意勾选“Add Python to PATH”选项,这样系统会为我们自动配置环境变量。在命令行输入 python,在命令行界面出现 python 程序终端,表示安装成功。
二、CUDA和cuDNN安装
可以看到我的电脑支持到CUDA 10.2 的版本,也就是不能安装比 10.2 更高的版本,所以我安装的版本是10.2的CUDA。
确定好版本之后,我们就开始 CUDA 的安装。首先去官网下载 CUDA 和 cuDNN。
下载好之后,我们进行安装。打开 CUDA 安装程序,按照安装指引一路确定 就行。下图表示 CUDA 的安装成功。
然后解压刚刚下载的 cuDNN 的压缩包,会得到 bin、include、lib 目录。 打开系统安装 CUDA 的目录,将 cuDNN 压缩包内对应的文件复制到对应 bin、include、lib 目录。 然后根据版本在电脑中配置环境变量。下图表示cuDNN安装成功。
三、深度学习框架安装
python 安装好之后,可以使用 python 的 pip 工具来安装所有 python 的库。包括pytorch。
从pytorch找到安装命令,进行安装。
下图表示pytorch安装完成。
四、环境验证
Pytorch 的测试代码如下:
import torch a = torch.tensor(1.) a.cuda()
# 若正常则返回 tensor(1., device='cuda:0')
from torch.backends import cudnn
cudnn.is_available()
# 若正常则返回 True
cudnn.is_acceptable(a.cuda())
# 若正常则返回 True
上图表示pytorch和cuda环境适配。
源码下载
根据论文附的代码网址进行下载并解压,得到下图。