微信扫描,关注珞珈图腾微信公众号
动态
当前位置: 首页 > 实验室概况 > 动态
珞珈图腾数据库实验室在数据库领域A类会议SIGMOD 2024上发表第一作者学术论文
浏览次数: | 评论次数: | 发布人:管理员 | 发布时间:2023/11/8 14:31:54

       近日,彭智勇教授研究组一篇题目为“F3KM: Federated, Fair, and Fast k-means”的学术论文被数据库领域A类会议ACM Conference on Management of Data (SIGMOD 2024) 录用。该论文第一作者为2023级博士生朱晟坤,通讯作者为王胜教授。

       本文提出了一种联邦、公平和快速的k-means算法(F3KM),以有效解决在数据不能在不同参与方之间共享的情况下进行公平聚类问题。所提出的算法将公平k-means问题分解为多个子问题,并将每个子问题分配给客户端进行本地计算。该算法允许每个客户端拥有多个敏感属性(或没有敏感属性),并提出了一种采用交替方向乘子方法(ADMM)来解决每个子问题的内处理方法。在解决子问题的过程中,仅在服务器和客户端之间交换计算结果,而不交换原始数据。理论分析表明,F3KM在通信和计算复杂性方面都很高效。具体来说,F3KM在效用和通信效率之间取得了更好的平衡,并将计算复杂度降低到与数据集大小成线性关系。实验表明,F3KM在效用和公平性之间取得了更好的平衡,优于其他方法。此外,F3KM能够在一小时内对五百万个数据点进行聚类,突显其出色的效率。

图片1.png