首页 / 百科
Facebook推出ReAgent AI强化学习工具包
2019-10-19 00:00:00
据外媒报道,Facebook近日推出ReAgent强化学习(reinforcement learning)工具包,首次通过收集离线反馈(offline feedback)来实现策略评估(policy evaluation)。
目前ReAgent已与Microsoft Azure顶尖AI平台实现合作。
一、“1+1+1”
Facebook AI Research近日推出了ReAgent,这是一种强化学习工具包,用于构建可以接收反馈的决策AI(decision-making AI)。ReAgent可以给用户行为评分,并将用户的输入行为(例如单击推荐内容)作为训练数据。
ReAgent是一个小型C ++库,可从GitHub下载,并在任何应用程序中嵌入。该工具包包含一组入门的决策AI模型,一个用于模型性能评估的离线模块,以及一个使用TorchScript库将AI部署到生产中的平台。
Horizon是一个强化学习平台,曾用于Facebook 2018年11月的开源生产中,现已成为ReAgent的一部分。
二、建立大规模实时决策AI模块变得简单
应用研究负责人Srinivas Narayanan近日在Facebook的@Scale会议上说,ReAgent现在每天要将数十亿个Facebook上的决定个性化(personalized),例如Facebook和Instagram上的用户通知。
Facebook曾在博客中提到:“ReAgent是各类创建AI推理系统(AI-based reasoning systems)的开源平台中最全面和模块化的,并且是第一个通过收集离线反馈来实现策略评估,从而改进模型的。”
“ReAgent让建立大规模的实时决策模块变得简单,同时也让创建和评估研究项目以及生产应用中的策略变得平民化(democratized)。
三、与Microsoft Azure合作
为了继续改进ReAgent,Facebook发布了将其应用在Microsoft Azure等云服务中的文档。Microsoft Azure今年年初推出了自己的强化学习服务。
▲图片来源:Microsoft,图中为Microsoft Azure的全球服务地区
在今年夏天Transform会议上的一次对话中,OpenAI首席技术官Greg Brockman和首席科学家Ilya Sutskever认为,未来AI发展的核心就是推理( reasoning)和可解释性(explainability)。
结语:开源是好事,也是大势所趋
谷歌和微软作为AI两大巨头,均有自己的开源AI开发平台,如谷歌的Google Cloud Prediction API和微软的Microsoft Azure Machine Learning。
如今Facebook也发布了自己的开源AI工具包。AI领域的研发门槛在不断降低,一些中小创企得以加入这场竞赛,也让这个领域不断注入新鲜的血液,充满活力。
充分竞争,交流融合,才会有更多灵感的迸发。
最新内容
手机 |
相关内容
从概念到生产的自动驾驶软件在环(Si
从概念到生产的自动驾驶软件在环(SiL)测试解决方案,测试,解决方案,自动驾驶,传感器,评估,车辆,自动驾驶软件在环(SiL)测试是一种在计算重庆东微电子推出高性能抗射频干扰
重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片,芯片,推出,算法,抑制,音频,信号,重庆东微电子有限公司最近推出了一款高性能DigiKey 推出《超越医疗科技》视频
DigiKey 推出《超越医疗科技》视频系列的第一季,推出,医疗科技,健康,需求,产品,诊断,全球供应品类丰富、发货快速的现货技术元器件苹果即将推出Mac系列新品,或搭载3nm
苹果即将推出Mac系列新品,或搭载3nm M3芯片,芯片,搭载,推出,全新,市场,研发,近日,有关苹果即将推出新一代Mac系列产品的消息引起了广英特尔不应该担心英伟达Arm架构的P
英特尔不应该担心英伟达Arm架构的PC芯片?恰恰相反,芯片,英伟达,英特尔,调整,研发,推出,英特尔目前是全球最大的半导体公司之一,主要以如何测量温度传感器的好坏?
如何测量温度传感器的好坏?,温度传感器,测量,精度,效应,性度,评估,FDS6679AZ温度传感器是一种用于测量环境温度的设备,它能够将温度转英飞凌推出XENSIV胎压传感器,满足智
英飞凌推出XENSIV胎压传感器,满足智能胎压监测系统的需求,智能,胎压传感器,推出,胎压监测系统,英飞凌,需求,英飞凌(Infineon)是一家全森萨塔推出首款经UL认证的A2L制冷
森萨塔推出首款经UL认证的A2L制冷剂泄漏检测传感器,检测,首款,认证,森萨塔,推出,传感器,森萨塔是一家专注于制冷和空调技术的领先公