「双塔模型java」双塔模型和单塔模型
今天给各位分享双塔模型java的知识,其中也会对双塔模型和单塔模型进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
- 1、塔顶产品组成xdmax怎么求
- 2、美团大脑百亿级知识图谱的构建及应用进展
- 3、基于ES实现电商语义搜索
- 4、广告系列:召回与排序
- 5、塔内什么两层塔板间的浓度关系
- 6、如何理解医院信息系统的双塔模型
塔顶产品组成xdmax怎么求
计算题(蒸馏) - 百度文库
7页发布时间: 2021年08月08日
组成如下:xF=0.5077,yF=0.7201。 (1) 假设塔顶产品组成 xD=0.99,塔底产品的组成为 xW=0.02,问最小回流比为多少?塔 底产品的纯度如何保证...
百度文库
第九章习题 - 百度文库
5页发布时间: 2020年05月28日
1. 欲得塔顶产物的组成为 60%时所需的理论板数;
2. 在设计条件下若板数不限,塔顶产物可能达到的最高浓度 xDmax。
百度文库
塔顶产品组成xdmax怎么求 - 资深教育答主答疑 - 问一问
在线
2232位教育培训答主在线答
已服务超1.5亿人5分钟内回复
Hi,为您实时解答教育类升学、学科答疑等问题,与高校名师、专家1对1在线沟通
塔顶产品组成xdmax怎么求
马上提问
双塔模型 推荐算法
120人正在咨询
理论塔板数的计算公式
138人正在咨询
图解法求理论塔板数
109人正在咨询
双塔模型 推荐算法
120人正在咨询
问一问
一、塔顶、塔釜产品量的计算 - 道客巴巴
1. 精馏塔的全塔物料衡算(2) 塔顶、 塔釜产品量的计算一般情况下, xF、 xD、 xW均已由生产条件规定, 已知F就可求出D和
2. 回收率、 产率的计算一、 塔顶、 塔釜产品量的计算问题3 什么是回收率?〖新课展开〗回答——是指某组分通过精馏回收的量与其在原料中的
道客阅读
大家还在搜
塔顶采用全凝器说明什么
塔顶产品量D怎么求
塔顶为全凝器说明Xd等于
双塔模型 推荐算法
图解法求理论塔板数
塔顶采出量计算公式
塔顶全凝器和分凝器的区别
精馏塔全塔物料衡算公式
...的二元理想混合液,已知回流比R=3,塔顶产品组成x - 百度知道
3个回答回答时间:2016年5月14日
最佳回答:根据回流比和Xd可写出精馏段操作线方程 题中给出X2 利用此关系可解出Y3=0.5775 最后应选第三项
百度知道
如何用计算机算精馏塔理论板,精馏理论塔板计算软件 - 黑之圣雷的博客 - CS...
1. 若塔顶冷凝器为全凝器,则y1= xD。按照气液相平衡关系式,由y1计算出第一层理论塔板上液相组成x1。
2. 按照精馏段操作方程,由第一层理论塔板下降的回流液组成x1,计算出第二层理论塔板上升的蒸气组成y2。再利用气液平衡关系式,由y2计算出第二层
3. 按精馏段操作线方程,由x2计算出y3。再按气液平衡关系式,由y3计算出x3。
CSDN编程社区
精馏的全塔物料衡算 - 百度文库
9页发布时间: 2022年04月24日
塔底产品W的量,若改用质量流量(kg/h)表示,则原料液组成xF、塔顶产品组成xD、塔底产品xW也改用...
百度文库
估算精馏塔塔顶和塔底产品的量和组成有哪两种方法 - 百度知道
1个回答回答时间:2021年12月5日
最佳回答:估算精馏塔塔顶和塔底产品的量和组成有两种方法:设定两vary - specification vary塔顶采量流比,specificatio...
百度知道
已知:塔顶产品组成:全凝器时为xD,分凝器时为y0,求:xD=y0时,两种...
已知:塔顶产品组成:全凝器时为xD,分凝器时为y0,求:xD=y0时,两种情况下的操作线方程。 相关知识点: 解析反馈 收藏 ...
百度教育
大家还在搜
精馏塔采出率公式
理论塔板数计算例题
塔顶产品量怎么算
塔底产品组成
理论塔板数的计算公式
精馏塔最小回流比公式
塔全高怎么算
塔顶和塔底产品流量
化工——第六章(精馏)习题答案 - 百度文库
42页发布时间: 2022年04月20日
1. 在1个大气压.84℃时,苯的饱和蒸气压PA*=113.6(kpa),甲苯的饱和蒸气压PB*=44.38(kpa),苯--甲苯混合溶液达于
2. 0.9232.56某理想混合液,其中一组平衡数据为xA=0.823,yA=0.923,此时平均相对挥发度为α=__________
3. 2.578在汽-液相平衡的t-x-y图中,液相线与汽相线将图平面平分为三个区:汽相线以上的区域称为_______
百度文库
化工原理Ⅱ计算题
3月2日试求:(1)塔顶和塔底产品量;(2)操作回流比;(3)精馏段操作线方程;(4)提馏段气、液相流率及操作线方程;(5)两进料间中间段的气、液相...
人人文库
知道塔顶的摩尔分数怎么求塔顶产品流量 – 960化工网问答
5天前知道塔顶的摩尔分数怎么求塔顶产品流量960化工网专业团队、用户为您解答,有知道塔顶的摩尔分数怎么求塔顶产品流量的疑问
960化工网
精馏复习题(2010) 南京廖华
7天前塔顶产品组成xD=0.9(摩尔分率),二元系统相对挥发度α=3,进料组成为xF=0.5(摩尔分率),回流比R=1时,求:(1)离开第一块板的液相组成X1为...
某二元连续精馏塔,保持进料流量、组成、热状态以及塔釜蒸发量不变,增加塔顶采出率,则塔顶产品组成xD和塔底产品组成xW如何变化?()
选项: A.xD减小,xW减小;;B.xD增大,xW减小;;C.xD减小,xW增大;;D.xD增大,xW增大。
答案: xD减小,xW减小;
精华吧
大家还在搜
塔顶进料只有提馏段
塔吊顶升原理图
双塔模型 推荐算法
图解法求理论塔板数
顶点式怎么配公式
理论塔板数计算例题
群塔作业方案
理论塔板数的计算公式
若在设计条件下塔板数不限,塔顶产物可能达到的最高含量XD,max。
2021年2月1日如图所示,含易挥发组分0.42(摩尔分数,下同)的双组分混合液在泡点状态下连续加入精馏塔塔顶,釜液组成保持0.02。物系的相对挥发度为2.5,塔顶不...
考试资料网搜题
馏塔计算方法 - 20210322152545.docx - 原创力文档
2021年3月24日适宜回流比,取图上曲线由急剧下降向平缓过渡阶段所对应的 R值作为操作回流比,得R=3.6 回流液热状况由塔顶产品组成XD=0.8047查得塔顶温度[1]...
原创力文档
化工原理第6章精馏复习题. - 搜档网
要求塔顶组成xD=0.9 (摩尔分率),取回流比为5,间接蒸汽加热,塔顶采用全凝器,试求:(1)塔底产品组成;(2) 塔顶全凝器每小时冷凝蒸汽量;(3...
搜档网
注册化工08第八讲 - 人人文库网
2月28日,其量和有侧线时获得的塔顶产品量相等,减少采出量和有侧线时获得的塔顶产品量相等,减少采出率,回流比不变,率,回流比不变,N=, xDmax=?
人人文库
大家还在搜
塔全高怎么算
塔底第一块板的液相组成Xw
迈达斯桁架建模
塔顶最大产量怎么计算
共顶点旋转模型
塔内分布器
顶点式的a怎么求
提升塔
超经典的精馏操作衡算全介绍!详细讲解全在这!
1. 全塔物料衡算(塔顶、塔底产品量的确定) 全塔物料衡算 对图10-20中的虚线圈作全塔物料衡算,可得F=D+W 全塔轻组分物料衡算
2. 理论板数的计算 (一)精馏段的物料衡算──精馏段的操作线方程 1.精馏段物料衡算 相邻两层板间汽液两流组成间(相遇两流)的关系
3. 实际塔板数与精馏塔的效率 板式塔的效率有几种不同的定义:全塔效率,板效率和点效率。
个人图书馆
...塔釜间接蒸汽加热,回流比R=3,要求塔顶馏出液组成xD=0.84,在...
1月16日求操作可得的塔顶、塔釜产品组成xD、xW。
上学吧找答案
蒸馏塔的设计 - - - 化工原理设计 - 文档之家
1. 设计任务: 生产能力(最大产量) : 2000kg/h 塔顶产品组成: 100%苯
2. 操作条件: 操作压力: 101.3Kpa 操作温度: 80℃ 进料热状态: 泡点进料
3. 设备形式: 筛板精馏塔,塔顶为全凝器,中间泡点 进料,塔底间接蒸汽加热,连续精 馏。 (二)设计内容 1.概述: 本次设计一筛板
文档之家
塔顶产品
2蒸馏操作的用途1工作原理利用液体混合物中各组分component挥发性volatility差异以热能为媒介使其部一定组成的料液被加热后经节流阀减压进入闪蒸...
豆丁网
例1在连续精馏塔中分离某二元理想溶液.DOC - max上传文档投稿赚钱...
2017年8月22日(摩尔分率,下同),塔顶易挥发组分回收率为80%,且塔顶组成xD=0.28,系统的平均相对挥发度α...
原创力文档
...而将塔顶泡点回流改为冷回流,则塔顶产品组成xD变化 - 考题宝
2021年7月20日精馏操作时,若其他操作条件均不变,只将塔顶的过冷液体回流改为泡点回流,则塔顶产品组成变化为()。 精馏操作时,若其他操作条件均不变,只将塔...
希赛网
化工原理吸收习题答案
试求:(1) 塔顶、底的产品量;(2) 塔釜中的气化量;(3) 塔顶第二块理论板上升的蒸汽组成。4. 如图 2 所示的精馏塔具有一块实际板,...
淘豆网
精馏塔计算例题下载 - Word模板 - 爱问共享资料
2019年5月11日试求该板的板效率解题思路假定此实际板为第1块板如图所示解题过程例4-3用一连续精馏塔分离苯-甲苯物系已知进料组成xF044要求塔顶组成达xD09...
爱问共享资料
...下同),操作回流比取最小回流比的1.4倍,所得塔顶产品组成为...
第1题 精馏塔分离双组分理想溶液。组成为0.5(轻组分A的摩尔分数,下同)的料液在泡点温度下加入塔内。塔顶蒸气先在分 精馏塔分离双组分理想溶液。
第2题 在连续精馏塔中分离某组成为0.5(易挥发组分的摩尔分数,下同)的两组分理想溶液。原料液于泡点下进入塔内。塔顶 在连续精馏塔中分离某组成为
第3题 在一连续精馏塔中分离二元理想混合液。原料液为饱和液体,其组成为0.5,要求塔顶馏出液组成不小于0.95,釜残液 组成不大于0.05(以上均为轻组分
赏学吧
恒馏出液组成常规间歇精馏过程模拟的数值计算误差
2月3日拟稳态法模拟理想条件下恒馏出物组成(恒顶浓)操作常规二元间歇精馏过程,计算过程总汽化量的程序为嵌套控制结构,即总汽化量的数值结果中含有中间...
大家还在搜
塔顶产品量D怎么求
塔吊顶升原理图
双塔模型 推荐算法
图解法求理论塔板数
顶点式怎么配公式
塔顶采出量计算公式
理论塔板数计算例题
塔顶产品量怎么算
精馏下载 - Word模板 - 爱问共享资料
2019年8月19日加入xf020摩尔分率下同今测得塔顶产品能回收原料液中易挥发组分的80且xD028系统的相对挥发度α25试求残液组成xw及该块塔板的板效率设蒸馏釜...
爱问共享资料
采用分凝器的塔由塔顶至塔底的逐板计算开始于:由x0(=xD)求y0()
采用分凝器的塔由塔顶至塔底的逐板计算开始于
美团大脑百亿级知识图谱的构建及应用进展
分享嘉宾:张鸿志博士 美团 算法专家
编辑整理:廖媛媛 美的集团
出品平台:DataFunTalk
导读: 美团作为中国最大的在线本地生活服务平台,连接着数亿用户和数千万商户,其背后蕴含着丰富的与日常生活相关的知识。美团知识图谱团队从2018年开始着力于图谱构建和利用知识图谱赋能业务,改善用户体验。具体来说,“美团大脑”是通过对美团业务中千万数量级的商家、十亿级别的商品和菜品、数十亿的用户评论和百万级别的场景进行深入的理解来构建用户、商户、商品和场景之间的知识关联,进而形成的生活服务领域的知识大脑。目前,“美团大脑”已经覆盖了数十亿实体、数百亿的三元组,在餐饮、外卖、酒店、到综等领域验证了知识图谱的有效性。今天我们介绍美团大脑中生活服务知识图谱的构建及应用,主要围绕以下3个方面展开:
--
“美团大脑”是什么?
以下是“美团大脑”构建的整体RoadMap,最先是2018年开始餐饮知识图谱构建,对美团丰富的结构化数据和用户行为数据进行初步挖掘,并在一些重要的数据维度上进行深入挖掘,比如说对到餐的用户评论进行情感分析。2019年,以标签图谱为代表,重点对非结构化的用户评论进行深入挖掘。2020年以后,开始结合各领域特点,逐个领域展开深度数据挖掘和建设,包括商品、美食、酒旅和到综和cross图谱等。
--
在搜索中,通常用户需要将其意图抽象为搜索引擎能够支持的一系列精搜关键词。标签知识图谱则是通过“标签”来承载用户需求,从而提升用户搜索体验。例如,通过标签知识图谱,用户可直接搜索“带孩子”或者“情侣约会”,就可返回合适的商户/内容供给。从信息增益角度来说,用户评论这种非结构化文本蕴含了大量的知识(比如某个商户适合的场景、人群、环境等),通过对非结构化数据的挖掘实现信息增益。该团队以生活服务领域的海量评论数据作为主要知识来源,通过标签挖掘、标签间关系挖掘以及标签-商户关联等关键技术,自下而上梳理用户需求,场景及主要关注点完成图谱构建。
标签知识图谱构建分为以下四个部分:知识抽取、关系挖掘、图谱打标和图谱应用。
① 知识抽取
标签挖掘采用简单的序列标注架构,包括Single span标签挖掘和跳字标签挖掘,此外还会结合语义判别或者上下文判别,采用远监督学习+结果投票方式获取更精准的标签。
② 关系挖掘
同义词挖掘:同义词挖掘被定义为给定包含N个词的池子,M个业务标签词,查找M中每个词在N中的同义词。现有的同义词挖掘方法包括搜索日志挖掘、百科数据抽取、基于规则的相似度计算等,缺乏一定的通用性。当前我们的目标是寻找通用性强,可广泛应用到大规模数据集的标签同义词挖掘方法。
以下是作者给出的同义词挖掘的具体方案,首先将离线标签池或者线上查询标签进行向量表示获取向量索引,再进行向量哈希召回,进一步生成该标签的TopN的同义词对候选,最后使用同义词判别模型。该方案的优势在于降低了计算复杂度,提升了运算效率;对比倒排索引候选生成,可召回字面无overlap的同义词,准确率高,参数控制简单。
对于有标注数据,主流的标签词嵌入表示方法有word2vec、BERT等。word2vec方法实现较为简单,词向量取均值,忽略了词的顺序;BERT通过预训练过程中能捕捉到更为丰富的语义表示,但是直接取[CLS]标志位向量,其效果与word2vec相当。Sentence-Bert对于Bert模型做了相应的改进,通过双塔的预训练模型分别获取标签tagA和tagB表征向量,然后通过余弦相似性度量这两个向量的相似性,由此获取两个标签的语义相似性。
对于无标注数据来说,可以通过对比学习的方法获取句子的表示。如图所示,Bert原始模型对于不同相似度的句子的向量相似度都很高,经过对比学习的调整之后,向量的相似度能够较好地体现出文本相似度。
对比学习模型设计:首先给定一个sentence,对这个样本做扰动产生样本pair,常规来说,在embedding层加上Adversarial Attack、在词汇级别做Shuffling或者丢掉一些词等构成pair;在训练的过程中,最大化batch内同一样本的相似度,最小化batch内其他样本的相似度。最终结果显示,无监督学习在一定程度上能达到监督学习的效果,同时无监督学习+监督学习相对于监督学习效果有显著提升。
同义词判别模型设计:将两个标签词拼接到Bert模型中,通过多层语义交互获取标签。
标签上下位挖掘:词汇包含关系是最重要的上下位关系挖掘来源,此外也可通过结合语义或统计的挖掘方法。但当前的难点是上下位的标准较难统一,通常需要结合领域需求,对算法挖掘结果进行修正。
③ 图谱打标:如何构建标签和商户供给的关联关系?
给定一个标签集合,通过标签及其同义词在商户UGC/团单里出现的频率,卡一个阈值从而获取候选tag-POI。这样会出现一个问题是,即使是频率很高但不一定有关联,因此需要通过一个商户打标判别模块去过滤bad case。
商户打标考虑标签与商户、用户评论、商户Taxonomy等三个层次的信息。具体来讲,标签-商户粒度,将标签与商户信息(商户名、商户三级类目、商户top标签)做拼接输入到Bert模型中做判别。
微观的用户评论粒度,判断每一个标签与提到该标签的评论(称为evidence)之间是正面、负面、不相关还是不确定的关系,因此可当作四分类的判别模型。我们有两种方案可选择,第一种是基于多任务学习的方法, 该方法的缺点在于新增标签成本较高,比如新增一个标签,必须为该标签新增一些训练数据。笔者最终采用的是基于语义交互的判别模型,将标签作为参数输入,使该模型能够基于语义判别,从而支持动态新增标签。
基于语义交互的判别模型,首先做向量表示,然后是交互,最终聚合比较结果,该方法的计算速度较快,而基于BERT的方法,计算量大但准确率较高。我们在准确率和速度上取balance,例如当POI有30多条的evidence,倾向于使用轻量级的方式;如果POI只有几条evidence,可以采用准确率较高的方式进行判别。
从宏观角度,主要看标签和类目是否匹配,主要有三种关系:一定不会,可能会,一定会。一般通过商户层关联结果进行投票结果,同时会增加一些规则,对于准确率要求较高时,可进行人工review。
④ 图谱应用:所挖掘数据的直接应用或者知识向量表示应用
在商户知识问答相关的场景,我们基于商户打标结果以及标签对应的evidence回答用户问题。
首先识别用户query中的标签并映射为id,然后通过搜索召回或者排序层透传给索引层,从而召回出有打标结果的商户,并展示给C端用户。A/B实验表明,用户的长尾需求搜索体验得到显著提升。此外,也在酒店搜索领域做了一些上线实验,通过同义词映射等补充召回手段,搜索结果有明显改善。
主要采用GNN模型实现,在构图中构建了两种边,Query-POI点击行为和Tag-POI关联信息;采用Graph Sage进行图学习,学习的目标是判断Tag和POI是否有关联关系或者Query和POI是否点击关系,进一步依据关联强度进行采样。上线后结果显示,在仅利用Query-POI信息构图时,线上无收益,在引入Tag-POI关联信息后线上效果得到显著提升。这可能是因为排序模型依赖于Query-POI点击行为信息去学习,引入Graph Sage学习相当于换了一种学习的方式,信息增益相对较少;引入Tag-POI信息相当于引入了新的知识信息,所以会带来显著提升。
此外,仅接入Query-POI向量相似度线上效果提升不佳,将Query和POI向量接入后效果得到显著提升。这可能是因为搜索的特征维度较高,容易忽略掉向量相似度特征,因此将Query和POI向量拼接进去后提升了特征维度。
该任务通过当前已知的Item去预测用户点击的Masked Item。比如说获取Item的上下文表征的时候,将相关的Attribute信息也进行向量表征,从而去判断Item是否有Attribute信息。
此外,还可以做Masked Item Attribute 预测,从而将标签的知识图谱信息融入到序列推荐任务中去。实验结果表明,引入知识信息后的准确率在不同的数据集上均有数量级的提升。同时,我们也做了线上转化的工作,将Item表征做向量召回;具体来说,基于用户历史上点击过的Item去召回topN相似的Item,从而补充线上推荐结果,在美食列表推荐页有显著提升。
--
菜品知识图谱的构建目标,一方面是构建对菜品的系统理解能力,另一方面是构建较为完备的菜品知识图谱,这里从不同的层次来说明菜品知识图谱的构建策略。
** * 菜名理解**
菜名中蕴含着最精准、获取成本最低的菜品信息,同时对菜名的理解也是后续显式知识推理泛化能力的前提。首先是抽取菜名的本质词/主体菜,然后序列标注去识别菜名中的每个成分。针对两种场景设计了不同的模型,对于有分词情况,将分词符号作为特殊符号添加到模型中,第一个模型是识别每个token对应的类型;对于无分词情况,需要先做Span-Trans的任务,然后再复用有分词情况的模块。
菜名理解是一个较为重要的信息来源,但是所蕴含的知识相对有限,从而提出了基于深度学习模型进行初步字符推断,可实现对不同字面表述的泛化处理。但是对需要专业知识的case表现欠佳,偶尔在字面极其匹配时出现case。
从知识内容丰富的文本中挖掘某些菜谱的基础知识,来构建源知识库;然后通过泛化推理去映射到具体SKU中。在食材推理中,比如菜品种有多道红烧肉,统计10道五花肉中有4道是指五花肉,6道是指带皮五花肉,因此肉就转化为带皮五花肉。对应地,佛跳墙有多道菜谱,先通过统计每种食材出现的概率,可以卡一个阈值,然后表明该菜谱的食谱是什么。
多源数据挖掘,基于菜名理解结果构建solid knowledge triple,同时也依赖菜名理解结果泛化规则。该策略主要适用于处理食材、功效、人群等标签。该方法准确率OK,有一定泛化能力,但覆盖率偏低。
业务内有一些比较好用的训练数据,例如1000万商户编辑自洽的店内分类树。基于该数据可产生5亿的 positive pairs 和 30G corpus。在模型训练中,会随机替换掉菜谱分类的 tab/shop,模型判断 tab/shop 是否被替换;50%的概率drop shop name,使得模型仅输入菜名时表现鲁棒。同时,对模型做了实体化改进,将分类标签作为bert的词进行训练,将该方法应用到下游模型中,在10w标注数据下,菜谱上下位/同义词模型准确率提升了1.8%。
首先使用ReseNet对菜谱图片进行编,使用Bert模型对菜谱文本信息做编码,通过对比学习loss去学习文本和店菜的匹配信息。这里采用双塔模型,一方面是下游应用较为方便,单塔模型可独立使用,也可inference出菜品图片的表示并缓存下来;另一方面是图片内容单纯,暂无交互式建模的必要。训练目标分别是图片与店菜匹配、图片与菜名对齐,图片与Tab对齐。
可基于多模态信息做菜品品类预测或者菜谱信息补全。比如,预测“猪肉白菜”加上了图片信息将更加直观和准确。基于文本和视图模态信息进行多视图半监督的菜谱属性抽取,以烹饪方式抽取为例,首先通过产生烹饪方法训练样本(红烧肉-红烧);然后采用CNN模型去训练预测菜谱烹饪方法,指导Bert模型Finetune文本模型或者多模态模型,基于商户/tab/菜品及评论信息预测菜品烹饪方法;最终对两个模型进行投票或者将两个特征拼接做预测。
综上,我们对菜品知识图谱构建进行相应的总结。菜品理解比较适合SKU的初始化;深度学习推理模型和显式推理模型比较适合做同义词、上下位、菜系等;最终是想通过多模态+结构化预训练和推理来解决单模态信息不完整、属性维度多、需要大量标注数据等问题,因此该方法被应用到几乎所有的场景中。
今天的分享就到这里,谢谢大家。
分享嘉宾:
基于ES实现电商语义搜索
在电商领域,如果仅仅依赖传统词匹配方式进行商品检索,会导致一些商品召回错误 影响用户体验;如 搜索【蛋糕奶油】结果查询出“奶油蛋糕“相关商品,搜索【车手】相关的宣传海报,结果找到了“汽车手机版”宣传海报
准备数据
特征转换
构建双塔模型并训练
考虑到输入都是短文本,故表示层才用了经典的长短记忆模型LSTM来构建双塔用于特征提取,输出层采用的是余弦相似,大家也可以求解向量点积,模型每日更新
导出特征
线上服务
传统的script检索
广告系列:召回与排序
实时竞价广告整体链路中,媒体侧发起请求,经ADX发向各DSP,DSP在对流量评估的基础上返回广告参与竞价,ADX比价后返回胜出广告,媒体展示并上报完成一次广告全流程。其中DSP在接收到广告请求后,需要在100-200ms内找出符合的广告返回给ADX,广告库中的候选数量庞大,一般在几十万-几百万之间,要在极短时间内完成对海量广告的打分评估,业界普遍的做法与推荐系统类似分为两个主要环节:召回+排序。
召回
召回的目的在于减少候选的数量(尽量控制在1000以内),方便后续排序环节使用复杂模型精准排序。因为在短时间内评估海量候选,所以召回的关键点是个快字,受限与此与排序相比,召回的算法模型相对简单,使用的特征比较少。业界普遍采用的方式是多路召回,即从多个维度出发在海量库里把相关度高的候选尽可能找出来。多路同时召回是出于多方面的考虑:
多样性,从不同维度出发去找到相关的候选;
鲁棒性,即使一路召回出现问题,其他召回通路也会正常运行不至于阻塞主流程;
可解释与灵活性,每一路从单独维度出发可以很好解释召回的逻辑,如果效果不理想调整起来复杂度低更加灵活。
在某一路召回时选好方向确定对应的打分函数,之后进行打分、排序、截断召回topN,各路召回之间彼此独立,胜出的候选之间不具有可比性。召回主要从用户(U)、上下文(C)、搜索词(Q)、广告(A)几个大方向出发,细化维度可以结合实际业务场景,可以基于上下文标题/描述/分类/标签/图片、用户基础统计信息/兴趣标签/历史行为、检索词、基于物品的协同过滤,处理的信息是多模态的包括文字、图片、视频等。具体召回匹配时有两种思路:
基于标签/关键词的文本硬匹配,如广告定向中的地域、性别,要么匹配,要么不匹配,扩展性及灵活度差一些;
基于向量的语义软匹配。选择有效的原始特征进行embedding嵌入向量空间,通过双塔模型学习获得用户、广告的向量表示,利用点积、余弦相似度或者欧氏距离等方式计算向量相关度,类似Youtube的推荐双塔和微软的DSSM。既可以改变阈值调整召回数量又能满足性能需求,是当前召回的主流形式。
召回不像排序阶段直接影响业务指标,经过粗排精排等环节作用后对最终结果的影响已经很小,对质量衡量难度相对较大,可以从两个方面出发尝试评估:
独特性,某路召回结果的不可替代或者与其他通路的重复度,重复度越高该路召回的价值越小;
转化效果,召回结果的后续表现,如精排后的排名或者被曝光后用户是否点击,效果越好价值越高。
排序
如果说召回是提供可能性,则排序是提供确定性:把最合适的候选找出来推给用户。排序细化可以分为粗排、精排、重排。粗排是召回阶段返回的候选数量还是太多,精排直接处理性能上不能满足,粗排用简单模型再做一次过滤减少数量,是个可选环节;重排则是出于业务考虑,对精排后的结果进行处理:多样性、频控、类别控制、特定结果提权等;精排是整个排序的关键,是各路模型的主战场,也是我们讨论的主角。
与召回相比,排序面对的候选在数量上急剧减少:只需要处理在召回阶段胜出的候选(如果整个创意库的量级在千级左右(如开屏广告/商店原生等)则可以全部召回直接用于排序),这为排序的发挥奠定了很好的基础:使用更多的特征与特征组合、复杂的模型对多路召回的结果统一评判打分、排序、截断topN输出。
为了更细致的刻画与拟合实际场景,排序阶段对模型的要求不断提高,伴随着技术的发展,从线性到非线性、从原始特征到低阶特征组合、高阶特征组合,到低高阶并存。如果说召回是基于表示的学习,其重点在学习用户和广告的向量表征,那么排序则是基于特征与特征组合的学习,尤其是高阶特征组合,整个排序模型发展的主方向就是对有效特征及特征组合的发现与使用。
召回与排序对整个广告有重要影响,其结果的好坏很大程度上决定了广告的质量和变现效果。它是广告链路上的一颗明珠,值得花精力精雕细琢。
上面介绍了召回与排序在整个广告链路中所属环节及各自作用,接下来主要介绍二者的异同及目标一致性问题。
相同点
召回与排序都是通过特征选取、模型构造,对候选集进行打分/排序/截断,将不符合的候选过滤,符合条件的候选进入下一环节,总体来讲召回排序环节选出了合适的候选。
差异点
1)、数据环境的差异
业界有句话,数据/特征决定了模型的上限,模型只是不断的去逼近它。因为模型学习的就是数据的内在规律和分布结构,为保证上线效果,训练数据要尽可能接近线上数据。
召回阶段处理的是全量候选,鱼龙混杂,其中绝大多数都与当前请求不相关;排序阶段面对的是已经通过了一次筛选,相关度已经有了很好的保障。基于二者环境的差异,在训练数据/样本的选择上需要注意,正样本的选择相对明确,重点在于负样本的选取,对于排序而言,曝光未点击的数据与线上环境基本接近(完全一致需要选取召回胜出的候选集,但此时的数据没有标记);对于召回而言,一种有效的做法是通过全局随机抽样来产生不相关的负样本。
2)、模型处理的差异
针对新的影响因素/特征,召回出于多样性和可解释等多方面考虑,一般会新增一路召回,导致了各路之间彼此独立,结果不可比;
排序是将新因素作为特征融入现有模型进行相关的特这组合交互,所有候选按照统一的标准打分评估。
召回与排序目标一致性
推荐和广告在很多方面有相似性,包括召回和排序面对的场景、处理思路、技术和实现,前面文章中提到广告对召回排序的处理借鉴推荐系统的做法,在一定程度上包含在目标的处理上,其实二者之间是有本质区别的。
推荐 :推荐系统产生的背景是因为商品/内容量级太大,用户想找到感兴趣的内容需要花费一定成本/时间,基于此提出推荐系统帮助用户快速找到感兴趣的内容,在相关性的基础上需要同时考虑内容的多样性、新颖和时效性,不能只根据用户行为历史生成推荐内容,否则容易造成用户审美疲劳,所以既要利用已知又要探索新的内容。从根本上讲属于用户体验问题,服务于用户满意度,最终提升用户活跃和留存,所以推荐的整体目标是:把用户喜欢的东西推荐给用户。
广告 :广告是从商业化角度出发,为了变现获取收益,与推荐相比广告的目标/诉求更加纯粹:收益最大化。在实时竞价广告中拍卖的商品是曝光,所以具化为曝光收益最大化。实际场景中考虑了收益最大化以外的因素一般都是广告和其他业务/场景在折中妥协后的结果(搜索场景的相关性/展示场景的类别/次数限制等),换个角度看也是为了广告走的更长远。
基于上述差异二者在召回与排序的目标和具体指标上会有所不同。
推荐在两阶段的总体目标基本一致:找出来用户喜欢的/相关的,具体操作上会有细微差别,召回一般用双塔衡量相关度,排序根据实际场景指标有所调整如点击率/观看时长/分享等。
广告两阶段的目标是基本分开的:
召回 :在全部候选中召回相关的候选集;
排序 :排序对最终结果直接产生影响,因此从商业化角度出发将收益最大的候选推出去。
召回与排序是前后相连的两个环节,如果二者目标不一致会影响商业化效率:召回的优质候选在排序阶段的排名可能比较靠后,排序阶段的优质候选在召回环节被过滤掉掉,百度在莫比乌斯的论文中也提到:召回阶段胜出相关性高的候选因为cpm不够高最终推出不去无法曝光。从广告的根本目标出发,为有效解决上述耗损问题,百度提出把排序的目标前移至召回阶段:召回就需要考虑商业化目标(ECPM),这对召回模型的复杂度提出了很高的要求,因为召回场景的特殊性需要同时兼顾性能和效果两个方面,关于这个点,阿里在深度树(TDM)的论文中提供了一种解决性能问题的方向:利用树结构进行高效的全局检索,这为解放召回阶段使用复杂模型点燃了星星之火,与百度提出的排序目标前移堪称广告的两大福音。
下一篇主要介绍召回排序在具体处理时采用的思路和方法。
塔内什么两层塔板间的浓度关系
计算题(蒸馏) - 百度文库7页发布时间: 2021年08月08日组成如下:xF=0.5077,yF=0.7201。 (1) 假设塔顶产品组成 xD=0.99,塔底产品的组成为 xW=0.02,问最小回流比为多少?塔 底产品的纯度如何保证...百度文库第九章习题 - 百度文库5页发布时间: 2020年05月28日1. 欲得塔顶产物的组成为 60%时所需的理论板数;2. 在设计条件下若板数不限,塔顶产物可能达到的最高浓度 xDmax。百度文库塔顶产品组成xdmax怎么求 - 资深教育答主答疑 - 问一问在线2232位教育培训答主在线答已服务超1.5亿人5分钟内回复Hi,为您实时解答教育类升学、学科答疑等问题,与高校名师、专家1对1在线沟通塔顶产品组成xdmax怎么求马上提问双塔模型 推荐算法120人正在咨询理论塔板数的计算公式138人正在咨询图解法求理论塔板数109人正在咨询双塔模型 推荐算法120人正在咨询问一问一、塔顶、塔釜产品量的计算 - 道客巴巴1. 精馏塔的全塔物料衡算(2) 塔顶、 塔釜产品量的计算一般情况下, xF、 xD、 xW均已由生产条件规定, 已知F就可求出D和2. 回收率、 产率的计算一、 塔顶、 塔釜产品量的计算问题3 什么是回收率?〖新课展开〗回答——是指某组分通过精馏回收的量与其在原料中的道客阅读大家还在搜塔顶采用全凝器说明什么塔顶产品量D怎么求塔顶为全凝器说明Xd等于双塔模型 推荐算法图解法求理论塔板数塔顶采出量计算公式塔顶全凝器和分凝器的区别精馏塔全塔物料衡算公式...的二元理想混合液,已知回流比R=3,塔顶产品组成x - 百度知道3个回答回答时间:2016年5月14日最佳回答:根据回流比和Xd可写出精馏段操作线方程 题中给出X2 利用此关系可解出Y3=0.5775 最后应选第三项百度知道如何用计算机算精馏塔理论板,精馏理论塔板计算软件 - 黑之圣雷的博客 - CS...1. 若塔顶冷凝器为全凝器,则y1= xD。按照气液相平衡关系式,由y1计算出第一层理论塔板上液相组成x1。2. 按照精馏段操作方程,由第一层理论塔板下降的回流液组成x1,计算出第二层理论塔板上升的蒸气组成y2。再利用气液平衡关系式,由y2计算出第二层3. 按精馏段操作线方程,由x2计算出y3。再按气液平衡关系式,由y3计算出x3。CSDN编程社区精馏的全塔物料衡算 - 百度文库9页发布时间: 2022年04月24日塔底产品W的量,若改用质量流量(kg/h)表示,则原料液组成xF、塔顶产品组成xD、塔底产品xW也改用...百度文库估算精馏塔塔顶和塔底产品的量和组成有哪两种方法 - 百度知道1个回答回答时间:2021年12月5日最佳回答:估算精馏塔塔顶和塔底产品的量和组成有两种方法:设定两vary - specification vary塔顶采量流比,specificatio...百度知道已知:塔顶产品组成:全凝器时为xD,分凝器时为y0,求:xD=y0时,两种...已知:塔顶产品组成:全凝器时为xD,分凝器时为y0,求:xD=y0时,两种情况下的操作线方程。 相关知识点: 解析反馈 收藏 ...百度教育大家还在搜精馏塔采出率公式理论塔板数计算例题塔顶产品量怎么算塔底产品组成理论塔板数的计算公式精馏塔最小回流比公式塔全高怎么算塔顶和塔底产品流量化工——第六章(精馏)习题答案 - 百度文库42页发布时间: 2022年04月20日1. 在1个大气压.84℃时,苯的饱和蒸气压PA*=113.6(kpa),甲苯的饱和蒸气压PB*=44.38(kpa),苯--甲苯混合溶液达于2. 0.9232.56某理想混合液,其中一组平衡数据为xA=0.823,yA=0.923,此时平均相对挥发度为α=__________3. 2.578在汽-液相平衡的t-x-y图中,液相线与汽相线将图平面平分为三个区:汽相线以上的区域称为_______百度文库
如何理解医院信息系统的双塔模型
双塔模型即HIS(医院信息建设指南)。
HIS具有“以病人为中心”的CIS和“以提高现代化管理及服务为中心”的MIS两大交互体系,称之为“双塔模式”。
具体是指利用计算机软硬件技术、网络通信技术等现代化手段,对医院及其所属各部门的人流、物流、财流进行综合管理,对在医疗活动各阶段产生的数据进行采集、储存、处理、提取、传输、汇总、加工生成各种信息,从而为医院的整体运行提供全面的、自动化的管理及各种服务的信息系统。
关于双塔模型java和双塔模型和单塔模型的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。