刷短视频时总被推一堆没兴趣的内容,网购时首页全是买过的同款,听歌App天天重复推荐那三首——你可能没意识到,背后是推荐算法在“努力工作”,但效果咋样?得靠几个硬核指标来打分。
准确率:推得对不对?
最直白的指标就是准确率(Precision)。比如你点了5个推荐商品,其中3个是你真想买的,那准确率就是 3/5 = 60%。它不关心你漏看了多少好东西,只盯住“推出来的有没有用”。日常刷资讯App时,如果首页10条里有7条点开看了还收藏了,说明这个算法在这块挺靠谱。
召回率:好东西漏没漏?
和准确率搭档的是召回率(Recall)。假设平台库里其实有8款适合你的蓝牙耳机,但只推给你3款,那召回率就是 3/8 = 37.5%。这就像朋友给你安利小众咖啡馆,光说对的不算本事,得把真正合你口味的都翻出来才算到位。电商做“猜你喜欢”时,召回率低,你就老刷不到新类型的好物。
F1值:准确和召回的平衡术
光看一个容易走偏,F1值就是把准确率和召回率揉在一起算的调和平均数:
F1 = 2 * (Precision * Recall) / (Precision + Recall)数值越接近1越好。它像做饭时盐和糖的配比——单撒一勺盐太咸,只加一勺糖太腻,F1帮你找到那个“刚刚好”的推荐节奏。覆盖率:别老围着熟人转
有的算法特别爱推热门款:爆款手机、顶流明星剧、全网都在晒的露营装备……结果冷门但优质的小众书、独立游戏、本地手作课程,永远上不了首页。覆盖率(Coverage)就是测它能触达多少不同种类的内容。数字越高,说明推荐池子越宽,不是总在原地打转。
多样性:别让我连刷10条猫视频
你刚搜完“健身计划”,接着弹出5个“帕梅拉跟练”、3个“刘畊宏跳操”、2个“深蹲教程”——信息高度重复。多样性(Diversity)就是衡量推荐列表里内容之间的差异程度。高多样性≠乱推,而是让你在运动类里看到力量训练、瑜伽、户外跑、康复拉伸等不同方向,像点外卖时既推酸菜鱼也推青椒肉丝,而不是10家店全推同一道菜。
下次再觉得“这App越来越不懂我”,不妨想想:它的准确率够不够稳?召回有没有偷懒?F1值是不是常年卡在0.4徘徊?覆盖率和多样性又有没有悄悄缩水?这些数字藏在后台,却实实在在决定着你每天刷到什么、买到什么、听到什么。