专利内容由知识产权出版社提供
专利名称:利用深度强化学习预测用户行为的方法及装置专利类型:发明专利发明人:阎翔,李晨晨
申请号:CN201811210445.7申请日:20181017公开号:CN109559216A公开日:20190402
摘要:本说明书实施例提供一种利用深度强化学习预测用户行为的方法和装置,其中方法包括,首先获取当前用户的特征数据作为深度强化学习的当前环境状态s,该特征数据至少包括,当前用户的资金相关数据。接着,将该特征数据输入深度神经网络,该深度神经网络被训练为,至少根据各种备选借贷动作a对应的奖励分数r,确定在当前环境状态s下,分别采取各种备选借贷动作,对应预期得到的各种累积奖赏Q;其中,各个备选借贷动作包括借款数额,借款时间和借款利率,对应的奖励分数r至少根据借款数额,借款时间和借款利率而确定。然后,根据得到的各个累积奖赏Q,在各种备选借贷动作中进行选择,作为预测的当前用户的借贷动作。
申请人:阿里巴巴集团控股有限公司
地址:英属开曼群岛大开曼资本大厦一座四层847号邮箱
国籍:KY
代理机构:北京亿腾知识产权代理事务所(普通合伙)
更多信息请下载全文后查看