1 基于马尔科夫决策的批量订购动态定价模型
1.1 问题描述与假设
(1)铁路公司销售一趟从A地直达B地的班列车票,在有限时间内完成销售,班列的座位容量有限。
(2)公司面临三种不同类型的顾客,第一类顾客为对价格非常不敏感,但对时间非常敏感,购票时选择购买高价票;第二顾客对价格非常敏感,对时间不敏感,倾向于购买低价票;第三类顾客对时间和价格均轻微敏感,选择购买中间价位车票。模型不考率低价顾客的升级购买行为。
(3)铁路公司针对不同车票进行定价,顾客到达后根据心理保留价格判断是否会购买车票。同一等级下顾客的心理保留价格独立同分布,且分布函数为已知的。
(4)顾客到达后以一定的概率进行批量购买,批量购买享受固定折扣,铁路公司设定最大购票数限制,限制倒卖车票行为。
(5)任何时间的订座需求是一个非负随机变量,并且不同时刻的需求相互独立。
(6)不考虑超售、退票和no-show(指:顾客购票后未成功乘车)
2.2 符号说明
建立模型需要如下的基本参数。
C为班列座位容量,即班列可装载的最大乘客数;t为决策阶段,0<t<T,t=0表示铁路公司开始销售车票,t=T表示销售的最后一期;i为顾客购买的座位等级,i=(1,2,…,I);pi为铁路公司针对第i个座位等级制定的价格。Λi=表示第i个座位等级的可行价格集,其中表示可行价格数目,不失一般性,假定:
(1)
(2)高等级座位的最高价格高于低等级座位的最高价格。
(3)pi∈Λi=[1,2,3],铁路公司针对第i个座位等级制定的价格从价格集Λi中选取。
N为预期全部类型车票产品的潜在顾客总数;βi为需求中i类顾客潜在需求的比例;为t时段需要i舱位票的潜在顾客需求到达率(到达率P=N/T,表示单位时间内到达的顾客),且记表示没有顾客到达的概率;Vt(x)为在t时刻,各路段剩余座位容量为x的情况下,从开始销售到t时刻铁路公司能取得的最大期望收益;f(pi)为第i个座位等级顾客在面临车票价格为pi时购买概率分布函数,为对应的概率累积函数,记表示顾客购买的概率。记R(p)=P·(1-F(p))·p表示实际收益率。
P(y=j)表示顾客到达后购买j张车票的概率,记P(y=
Di(j)表示第i类顾客批量购买j张车票能享受的折扣。
1.2 模型
由假设知,铁路公司的售票期间内存在一个马尔科夫生灭过程。在该过程内,公司在离散时间下进行决策。将时间区间划分为足够多的决策阶段,使得在单位阶段内到最多到达一个潜在顾客。铁路公司通过定价影响消费者需求,在每个阶段,分别对不同类型的购票请求进行接受或拒绝,以实现销售期间内总收益最大。
为了便于分析和计算,设定足够大的离散时间阶段(T个阶段),由此将时间区域[T,0]划分成单位长度为1的决策周期。假设在任意时刻t,公司面临剩余座位数量为K,则期望收益Vt(K)可以由前一阶段多个状态的收益转移而来。铁路售票公司面临的马尔科夫决策过程表示如图1所示。
图1 公司决策过程示意图
由图知,当决策期间内没有顾客到达时,Vt(K)由转移而来;当第i类顾客到达后,因车票售价超出其心理保留价格选择放弃购买的,由转移而来;当顾客到达后决定购买j张车票时,由转移而来。铁路公司选择接受或是拒绝购买的条件为(当且仅当)。
故T期间内,最大座位容量为C时,铁路公司能获得期望收益
式(1)的约束条件为:
(1)V0(x)=0,?x∈[0,T],这表明销售期开始前,不论剩余座位多少,期望总收益为零。
(2)Vt(0)=0,这表明,剩余座位为零的情况下,期望总收益为零。
定义一组包含所有产品的价格的数组为一个价格方案,那么记P*=arg max(VT(C)),P*∈Γ为最优价格方案,其中Γ为价格方案的全集。
1.3 求解简化过程——最大凹向包络理论
最大凹向包络定理:取任意k≥0,收益函数V(t,k)对任何预先确定的价格集合Γ,存在一组价格子集
Γ0∈Γ,Γ0={p1,p2,…,pnum},满足:
(1)在价格Γ0下,R(λ)是的λ凹函数,单调递增;
(2)对任意价格Γ1,Γ0?Γ1?Γ,且Γ1≠Γ0,R(λ)不是λ的凹函数或者递增函数;
(3)如果pi∈/Γ0,任意时刻pi不能成为决定价值函数Vt(k)的最优价格。
对本模型,全部采用最高价格的方案始终在最优价格子集中;除Γ1外的其他价格方案如果包含包络线上,必须满足以下条件,其中l=1,2,…,L-k,L表示所有可行价格方案的个数。搜索最优定价时,仅对包络线中包含的价格组合需予以考虑,将能显著降低计算量。
下一篇:没有了
Copyright © 2018 《采矿与安全工程学报》杂志社 版权所有