动态谷歌开源TFRanking专用于排序略

2020-10-18 11:31:26 来源: 永州信息港

动态 | 谷歌开源 TF-Ranking:专用于排序学习的可扩展 TensorFlow 库

AI 科技评论按:日前,谷歌 AI 发布了最新成果 TF-Ranking,它是一个专门进食肉食最多组较最少组血尿酸水平高0.48mg/dl。进食海产品最多组较最少组升高0.16mg/dl。值得注意的是针对排序学习(learning-to-rank)应用的可扩展 TensorFlow 库。TF-Ranking 快速且易用,并能创建高质量的排序模型,对构建 web 搜索或新闻推荐等基于真实世界数据的排序感兴趣的人,都可以将 TF-Ranking 作为强稳的、可扩展的解决方案。

排序是一种以最大化整个列表效用为目的,对项目列表进行排序的过程,适用于搜索引擎、推荐、机器翻译、对话,甚至还能用于计算生物学等众多领域。在诸如这些(以及其他诸多)应用中,研究人员经常使用一系列称作排序学习的有的机器学习技术。在许多情况下,这些排序学习技术会被应用于大规模数据集,在这一场景中,TensorFlow 的可伸缩性会成为一个优势。然而,目前 TensorFlow 还不能直接支持学习排序。并且,现在也还没有其他专门针对排序学习技术规模化应用的开源库。

TF-Ranking 快速且易用,并能创建高质量的排序模型。该统一框架让机器学习研究人员、实践者和爱好者能够在单个库中评估和选择一系列不同的排序模型。此外,谷歌 AI 团队坚信一个有用的开源库,它的关键不仅在于合理的默认值(sensible default)而且还在于能够授权用户自定义模型。为此,他们了灵活的 API,让用户可以在 API 中定义和插入自定义的损失函数、评分函数和指标。

现有算法和指标支持

TensorBoard 上显示的基于训练步骤(X 轴)的 NDCG 指标 (Y 轴)示例,它表示了训练期间指标的总体进度。不同的方法可直接在仪表板上进行比较,并基于指标选出最佳模型。

多条目评分

TF-Ranking 支持一种新的评分机制,在新的评分机制中可以对多个条目进行联合评分,这是对只能对单个条目进行独立评分的传统评分机制的扩展。多条目评分面临的一个是难以推断哪些条目必须进行分组并在子组中评分。每个条目累积下来的分数将被用于排序。TF-Ranking 了一个 List-In-List-Out(LILO)API,来将所有这些逻辑放入导出的 TF 模型中。

TF-Ranking 库支持扩展自传统单条目评分的多条目评分架构。

排序评价指标优化

排序学习所面临的一个重要研究是排序评价指标的优化(例如前面所提到的 NDCG 和 MRR)虽然与 Area Under the Curve(AUC)之类的标准分类评价指标相比,这些评价指标能更好地衡量排序的性能,但可惜它们要么不连续,要么平滑。因此,这些评价指标的标准随机梯度下降优化存在困难。

无偏见排序学习

开启 TF-Ranking 的使用

TF-Ranking 实现了 TensorFlow Estimator 接口,它通过封装训练、评估、预测和导出服务,可以大大简化机器学习编程。

Via:

培哚普利氨氯地平片与氨氯地平贝那普利片的区别
小孩健脾胃的药有哪些
小儿脾胃虚弱的治疗
小孩脾胃虚弱怎么办
本文标签: