Posts



单机数仓环境搭建备忘

发布于 2024-06-08

选型版本 JDK 1.8 Hadoop 3.3.6 Spark 3.5.1 Scala 2.12.19 Hive 3.1.3 Hbase 2.2.3(phoenix-hbase 2.2-5.1.3) Flink 1.16.3 Flink CDC 3.0.1 安装配置 H...




流式更新索引一致性问题

发布于 2024-06-06

召回流式更新的目的:加强学习物品表征与用户表征的实时性,尤其是近线模型更新间隔产生交互行为的用户和物品的表征。 召回流式更新的问题: 向量召回特有问...


 

多任务学习与推荐系统

发布于 2024-03-11

简介 大多数机器学习模型都是独立来进行学习的,即单任务学习(single-task learning)。也就是说,我们针对一个特定的任务,设计一个模型,然后进行迭代优化...




关于推荐系统中冷启动问题的一些看法

发布于 2024-03-09

冷启动问题 推荐系统的冷启动问题指的是在系统面临新用户或新物品时,由于缺乏足够的历史数据而难以进行有效的个性化推荐。对于新物品而言,缺乏历史行为数据...




如何构建最小化现代推荐系统实例

发布于 2024-02-13

更新 [2024.7]数仓部分架构更新 前言 经过一年多将近两年的学习,我将推荐系统作为研究生期间的主要研究方向。在这个过程中,我深入阅读了许多论文和资料,...




石塔西面试题解答(部分)

发布于 2024-02-10

特征工程 为什么说,用物料的后验消费数据做召回存在“幸存者偏差”?能将这些消费数据用于排序吗? 后验消费数据是历史交互的统计总和,可以描述一个物料相...




三星970evo plus爆0e引发的远程救援

发布于 2024-01-22

故障初始表现为控制台开始显示一些输入输出错误,初步定为I/O问题。使用smartctl查看硬盘SMART信息后发现,作为根目录盘的三星970 EVO Plus 1TB的0E参数已经...