
带噪音的社交网络对齐
大赛介绍
Register · remaining
About this hackathon
### 大赛介绍
CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。
大赛迄今已成功举办九届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的16万余人参与,已成为中国大数据与人工智能领域影响力最广、参赛规模最大、成熟度最高的综合赛事之一。2022年,我们将迎来第十届CCF BDCI,十年磨砺,创新聚力再出发,CCF BDCI将进一步扩大影响力,关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。
本赛题为大赛赛题之一,另含算法赛道、自主平台赛道、系统赛道、训练赛道等二十余道竞技及训练赛题,查看全部赛题可点击进入 **[2022 CCF大数据与计算智能大赛(CCF BDCI)](https://www.datafountain.cn/special/BDCI2022)** 官网。
### 赛题介绍
**• 赛题背景**
各种类型的社交网络和应用已经进入到人类生活中的方方面面。人们在新浪微博上分享日常并与好友保持联络,在LinkedIn上进行求职招聘,在Arxiv.org上获取和分享学术成果等。
社交网络(节点)对齐,是在多个社交网络之间找到对应的用户,这些对应用户属于真实世界中的同一个自然人。融合不同社交网络的数据可以从多个角度对用户建立更为立体、全面、综合的画像,挖掘其本质特征,进行更精准的分析和服务。近年来在这一领域已有很多研究成果及论文(参考“研究论文”一节)。一些相关研究将此问题称作社交网络用户对齐、用户身份链接、锚链路预测、用户匹配等。
值得注意的是,在真实应用中,网络中的结构差异信息和已知锚点对中的噪音会给对齐任务带来巨大的挑战。假设待对齐的两个社交网络分别为G1和G2,nodes(G1)和nodes(G2)分别表示G1和G2的所有节点的集合。为简化任务且不失一般性,这里可假设nodes(G1)=nodes(G2)。对齐任务就是识别G1和G2中属于同一自然人的“用户节点对”。真实应用中的网络差异信息和噪音可以简化为以下两种情况:
▪ 网络结构差异:由于信息获取限制和不同社交网络的功能差异,网络G1和G2在结构上会存在不同,记为G1和G2网络结构的差异率alpha。
▪ 锚点监督信息的噪音:对于G1和G2的“用户节点对”,在真实应用中通常会有少量“锚点监督信息”(可能是人工标注的)。这些监督信息可能会给对齐算法带来帮助。但真实情况中这些对齐信息本身可能带有“噪音”(错误率),记为beta。对于对齐任务而言,beta度量的是G1和G2锚点监督信息的错误率。
上述两种信息差异或噪音情况(alpha和beta)均会给社交网络对齐任务带来困难。设计出能够应对带有噪音的社交网络对齐算法,能够让算法更加贴近和适合真实应用条件,具有重要的现实意义。
**• 研究论文**
> ▪ Multilingual Knowledge Graph Embeddings for Cross-lingual Knowledge Alignment (IJCAI17)
> ▪ Cross-lingual Knowledge Graph Alignment via Graph Convolutional Networks (EMNLP18)
> ▪ Regal: Representation Learning-based Graph Alignment (CIKM18)
> ▪ Bootstrapping Entity Alignment with Knowledge Graph Embedding (IJCAI18)
> ▪ Multi-Channel Graph Neural Network for Entity Alignment (ACL19)
> ▪ Two-stage entity alignment: Com
Tracks
General Track
### 大赛介绍 CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。 大赛迄今已成功举办九届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的16万余人参与,已成为中国大数据与人工智能领域影响力最广、参赛规模最大、成熟度最高的综合赛事之一。2022年,我们将迎来第十届CCF BDCI,十年磨砺,创新聚力再出发,CCF BDCI将进一步扩大影响力,关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。 本赛题为大赛赛题之一,另含算法赛道、自主平台赛道、系统赛道、训练赛道等二十余道竞技及训练赛题,查看全部赛题可点击进入 **[2022 CCF大数据与计算智能大赛(CCF BDCI)](https://www.datafountain.cn/special/BDCI2022)** 官网。 ### 赛题介绍 **• 赛题背景** 各种类型的社交网络和应用已经进入到人类生活中的方方面面。人们在新浪微博上分享日常并与好友保持联络,在LinkedIn上进行求职招聘,在Arxiv.org上获取和分享学术成果等。 社交网络(节点)对齐,是在多个社交网络之间找到对应的用户,这些对应用户属于真实世界中的同一个自然人。融合不同社交网络的数据可以从多个角度对用户建立更为立体、全面、综合的画像,挖掘其本质特征,进行更精准的分析和服务。近年来在这一领域已有很多研究成果及论文(参考
Schedule
Aug 14, 08:00 AM
Dec 31, 07:59 AM
Tags
Comments
0Similar hackathons

FutureForge Hackathon 2026
Dream Big. Build Bigger.

HexaFalls 2
Let the Night Owl be your Spirit 🦉

Ignisys 1.O
Code • Create • Conquer