GNN实战：用PyTorch Geometric搞定社交网络节点分类（附Cora数据集完整代码）

张开发

• 2026/5/11 15:15:24 • 15 分钟阅读

分享文章

GNN实战用PyTorch Geometric搞定社交网络节点分类附Cora数据集完整代码当你在社交平台上看到可能认识的人推荐时背后很可能就运行着图神经网络GNN。这种能够捕捉复杂关系的数据结构正在推荐系统、欺诈检测等领域大放异彩。今天我们就用PyTorch Geometric这个利器带你从零实现一个真实的学术论文引用网络分类任务。1. 环境配置与数据准备工欲善其事必先利其器。我们先来搭建实验环境conda create -n gnn python3.8 conda activate gnn pip install torch torch-geometric torch-scatter torch-sparse -f https://data.pyg.org/whl/torch-1.10.0cu113.htmlCora数据集包含2708篇学术论文分为7个类别如神经网络、概率方法等。每篇论文用1433维的词向量表示引用关系构成5429条边。来看看如何加载数据from torch_geometric.datasets import Planetoid import torch_geometric.transforms as T dataset Planetoid(root./data, nameCora, transformT.NormalizeFeatures()) data dataset[0] print(f节点数: {data.num_nodes}) # 2708 print(f边数: {data.num_edges}) # 5429 print(f特征维度: {dataset.num_features}) # 1433 print(f类别数: {dataset.num_classes}) # 7数据对象包含以下关键属性x: 节点特征矩阵2708×1433edge_index: 边索引2×5429y: 节点标签2708train_mask/test_mask/val_mask: 划分训练/测试/验证集提示NormalizeFeatures变换会自动对节点特征做L1归一化这对GNN训练稳定性很重要2. 构建图卷积网络模型现在搭建一个双层GCN模型结构如下输入层(1433) → GCN(16) → ReLU → Dropout → GCN(7) → Softmax具体实现代码import torch import torch.nn.functional as F from torch_geometric.nn import GCNConv class GCN(torch.nn.Module): def __init__(self, hidden_channels16): super().__init__() self.conv1 GCNConv(dataset.num_features, hidden_channels) self.conv2 GCNConv(hidden_channels, dataset.num_classes) self.dropout 0.5 def forward(self, x, edge_index): x self.conv1(x, edge_index) x F.relu(x) x F.dropout(x, pself.dropout, trainingself.training) x self.conv2(x, edge_index) return F.log_softmax(x, dim1)关键组件解析GCNConv: 实现图卷积操作公式为Z D^(-1/2) A D^(-1/2) X W其中A是邻接矩阵D是度矩阵W是可学习权重第一层将1433维特征压缩到16维隐藏空间第二层映射到7维输出空间对应7个类别3. 模型训练与评估训练流程采用标准监督学习范式device torch.device(cuda if torch.cuda.is_available() else cpu) model GCN().to(device) data data.to(device) optimizer torch.optim.Adam(model.parameters(), lr0.01, weight_decay5e-4) def train(): model.train() optimizer.zero_grad() out model(data.x, data.edge_index) loss F.nll_loss(out[data.train_mask], data.y[data.train_mask]) loss.backward() optimizer.step() return loss.item() def test(): model.eval() out model(data.x, data.edge_index) pred out.argmax(dim1) correct pred[data.test_mask] data.y[data.test_mask] acc int(correct.sum()) / int(data.test_mask.sum()) return acc for epoch in range(1, 201): loss train() if epoch % 20 0: acc test() print(fEpoch: {epoch:03d}, Loss: {loss:.4f}, Acc: {acc:.4f})典型训练输出Epoch: 020, Loss: 1.5321, Acc: 0.7820 Epoch: 040, Loss: 0.9234, Acc: 0.8140 Epoch: 060, Loss: 0.7158, Acc: 0.8250 Epoch: 080, Loss: 0.6023, Acc: 0.8310 Epoch: 100, Loss: 0.5281, Acc: 0.8350注意验证集准确率通常在83%左右波动这与论文报告的基准结果一致4. 高级技巧与优化方案4.1 模型深度与过平滑问题增加GCN层数可能导致性能下降这就是著名的过平滑现象。我们测试不同层数的表现层数验证集准确率训练时间(秒)283.5%12.4382.1%15.7480.3%18.9578.6%22.3解决方法添加残差连接使用Jumping Knowledge网络尝试GAT等注意力机制4.2 邻居采样与大规模图处理对于超大规模图如百万节点可以使用采样技术from torch_geometric.loader import NeighborLoader loader NeighborLoader( data, num_neighbors[10, 5], # 两层采样每层采样10和5个邻居 batch_size32, input_nodesdata.train_mask ) for batch in loader: # 小批量训练逻辑 ...4.3 可视化节点嵌入用UMAP可视化学习到的节点表示import umap import matplotlib.pyplot as plt model.eval() out model.conv1(data.x, data.edge_index) out out.detach().cpu().numpy() reducer umap.UMAP() embedding reducer.fit_transform(out) plt.scatter(embedding[:,0], embedding[:,1], cdata.y.cpu(), s10, cmapSet1) plt.colorbar() plt.show()你会看到同类论文在嵌入空间中形成明显聚类这正是GNN的强大之处——同时利用节点特征和图结构信息。

更多文章

前端开发 2026/5/8 6:15:19

PyInstaller打包实战：如何优雅地把你的机器学习模型（.pth文件）和前端资源一起塞进exe

PyInstaller高级打包指南：机器学习模型与前端资源的无缝整合当你花费数周时间训练出一个精准的机器学习模型，又精心设计了交互界面，最后却卡在交付环节——客户电脑上没有Python环境，或者缺少必要的依赖库。这种场景下&#xff0…

张开发

前端开发 2026/5/11 7:51:43

MCMC算法在Statistical Rethinking 2023中的终极应用指南

MCMC算法在Statistical Rethinking 2023中的终极应用指南【免费下载链接】stat_rethinking_2023 Statistical Rethinking Course for Jan-Mar 2023 项目地址: https://gitcode.com/gh_mirrors/st/stat_rethinking_2023 Statistical Rethinking 2023课程是一门专注于现代…

张开发

前端开发 2026/5/8 6:15:21

终极Codebox桌面应用构建教程：Linux和Mac完整配置指南

终极Codebox桌面应用构建教程：Linux和Mac完整配置指南【免费下载链接】codebox Open source cloud & desktop IDE 项目地址: https://gitcode.com/gh_mirrors/co/codebox Codebox作为一款开源的云桌面IDE，为开发者提供了强大的代码编辑和项目…

张开发

前端开发 2026/5/8 6:15:23

VOICEVOX完全攻略：免费开源日语语音合成软件从零开始精通

VOICEVOX完全攻略：免费开源日语语音合成软件从零开始精通【免费下载链接】voicevox 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのエディター项目地址: https://gitcode.com/gh_mirrors/vo/voicevox VOICEVOX是一款免费开源的日语语音合成…

张开发

前端开发 2026/5/8 6:15:22

.NET Windows Desktop Runtime终极指南：如何彻底解决Windows应用部署难题

.NET Windows Desktop Runtime终极指南：如何彻底解决Windows应用部署难题【免费下载链接】windowsdesktop 项目地址: https://gitcode.com/gh_mirrors/wi/windowsdesktop 你是否曾经为Windows桌面应用的部署问题而烦恼？是否遇到过应用在开发环境…

张开发

前端开发 2026/4/20 10:12:21

终极编程语言图标资源库：一站式高清技术标识解决方案

终极编程语言图标资源库：一站式高清技术标识解决方案【免费下载链接】programming-languages-logos Programming Languages Logos 项目地址: https://gitcode.com/gh_mirrors/pr/programming-languages-logos 在当今数字化时代，技术文档、开发博…

张开发

前端开发 2026/5/8 6:15:23

四川省中小学和职业院校教师校长省级培训专家库专家名单

根据《四川省教师发展中心关于遴选与更新中小学和职业院校教师校长省级培训专家库专家的通知》要求，全省共收到申报材料1514份（更新专家库申报材料593份，新增专家库申报材料921份）。评审工作专班本着客观、公平、公正的原则&…

张开发

前端开发 2026/5/8 6:15:24

如何使用Spicetify CLI定制你的Spotify客户端：完整指南

如何使用Spicetify CLI定制你的Spotify客户端：完整指南【免费下载链接】spicetify-cli Command-line tool to customize Spotify client. Supports Windows, macOS, and Linux. 项目地址: https://gitcode.com/gh_mirrors/sp/spicetify-cli Spicetify CLI是…

张开发

前端开发 2026/5/8 6:15:27

别再搞混了！LP/mm、Cycles/pixel这些分辨率单位到底怎么用？附换算表

分辨率单位全解析：从LP/mm到Cycles/pixel的实战指南每次看到镜头参数表里那些LP/mm、Cycles/pixel之类的术语，是不是感觉像在读天书？上周我帮朋友选工业相机时，发现不同厂商用不同单位标注分辨率，结果差点买错设备。今…

张开发

前端开发 2026/5/8 6:27:31

别再傻傻分不清！一文讲透T-BOX和OBD盒子的前世今生与选购指南

别再傻傻分不清！一文讲透T-BOX和OBD盒子的前世今生与选购指南当你打开电商平台搜索"车载智能盒子"，会发现从几十元到上千元的产品琳琅满目，功能描述更是五花八门——远程控车、驾驶分析、故障诊断、UBI保险...这些被统称为"盒…

张开发

前端开发 2026/5/8 6:15:25

Sloth：轻松实现 Prometheus SLO 监控的终极指南

Sloth：轻松实现 Prometheus SLO 监控的终极指南【免费下载链接】sloth 🦥 Easy and simple Prometheus SLO (service level objectives) generator 项目地址: https://gitcode.com/gh_mirrors/slo/sloth Sloth 是一款简单高效的 Prometheus SLO&…

张开发

前端开发 2026/5/7 16:57:14

Vue3项目中集成Luckysheet：从零构建在线Excel协作界面

1. 为什么选择Vue3 Luckysheet组合？ 如果你正在寻找一个轻量级、高性能的在线表格解决方案，Vue3和Luckysheet的组合绝对值得考虑。我最近在一个项目管理系统中使用了这个技术栈，实测下来开发效率和用户体验都非常不错。 Luckysheet是一个纯…

张开发

GNN实战：用PyTorch Geometric搞定社交网络节点分类（附Cora数据集完整代码）

最新文章

EF Core 10向量搜索扩展仅支持.NET 8+？不！这3种降级兼容方案已被头部金融客户验证上线

从Kaggle竞赛到工业落地：MATLAB环境下XGBoOST调参的实战避坑指南

保姆级教程：用Python和LQR从零实现自动驾驶横向控制（附MATLAB代码对比）

别再自己搭文件服务器了！Spring Boot整合阿里云OSS，5分钟搞定图片上传功能

高德/百度地图API实战：如何用AOI数据给你的POI打上“商圈”标签？

架构师视角：vue-office在企业级文档预览系统中的技术实现与优化策略

推荐文章

相关文章

分享文章

更多文章

PyInstaller打包实战：如何优雅地把你的机器学习模型（.pth文件）和前端资源一起塞进exe

MCMC算法在Statistical Rethinking 2023中的终极应用指南

终极Codebox桌面应用构建教程：Linux和Mac完整配置指南

VOICEVOX完全攻略：免费开源日语语音合成软件从零开始精通

.NET Windows Desktop Runtime终极指南：如何彻底解决Windows应用部署难题

终极编程语言图标资源库：一站式高清技术标识解决方案

四川省中小学和职业院校教师校长省级培训专家库专家名单

如何使用Spicetify CLI定制你的Spotify客户端：完整指南

别再搞混了！LP/mm、Cycles/pixel这些分辨率单位到底怎么用？附换算表

别再傻傻分不清！一文讲透T-BOX和OBD盒子的前世今生与选购指南

Sloth：轻松实现 Prometheus SLO 监控的终极指南

Vue3项目中集成Luckysheet：从零构建在线Excel协作界面