城市直播房产教育博客汽车
投稿投诉
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

未来一大不容忽视的问题人工智能安全性

  截至目前,AI安全仍是一个十分新的领域。本篇文章分别从规范性、鲁棒性、保证性三个方面出发进行全面分析,帮助大家了解AI安全。
  制造一枚火箭是十分困难的事情,每一个零部件都需要进行细致的设计和制造以保证火箭的安全性和可靠性。
  从导航系统到控制系统,从发动机到着陆器,每个方面都需要进行严格的测试和检验,然后才能建成稳定可靠的火箭运送宇航员奔向太空。
  如果人工智能也是一枚火箭的话,安全性同样是其中十分重要的部分。
  它的保证来源于从头开始对于系统的仔细设计来保证不同的元件能够按照我们的想法协同工作,并在部署后可以正常地监控各个部分的工作状态。
  Deepmind的AI安全研究主要致力于保证系统可靠地工作,同时发现并处理近期和长期可能的危险。
  AI安全是一个十分新的领域,本文主要将就技术AI安全的三个方面展开讨论:规范性(准确定义系统的目的)、鲁棒性(系统抗干扰的能力)和保证性(监控系统活动),从不同的角度定义并保证了AI系统的安全性。
  一、规范性与准确性:清晰定义系统目的
  这一特性保证了AI系统可以按照使用者的真实意图准确完成任务,对于目的有着规范和清晰的定义十分重要。
  有一个古希腊的神话故事从反面说明了这个道理。一位古希腊的国王受到了神的眷顾,可以许一个愿望。他不假思索的告诉神希望能将所有他触碰的东西变成金子!在神赋予他获得这项能力后,他大喜过望,周围的树根、石头、花瓣都在他的触碰下变成了金子!但高兴不了太久国王就发现了一个严重的问题,当他想喝水吃饭时食物和水都在他的手里变成了黄金,无法正常进食喝水。甚至在某些版本的故事里,国王的女儿也成为这种能力的受害者。
  这个故事告诉了我我们一个道理:如何阐释和表达我们的需求是十分重要的。
  在AI系统中规范清晰的设计是保证AI系统忠实地执行设计者愿望的保证,而含糊或者错误的定义则会造成灾难性的后果。
  在AI系统中,研究人员一般将规范定义分为了三种类型:
  理想的定义(美好的愿望):根据假设的(一般难以实现)描述来定义的理想AI系统,会完全按照人类的意图行事。
  设计的定义(美妙的蓝图):实际构建AI系统所用设计语言,例如强化学习系统中经常要最大化的奖励函数。
  实际的定义(令人无奈的现状):这种情况很好地描述了系统的实际情况。
  例如:很多时候会根据系统的表现和行为进行反向工程来求出奖励函数(逆向强化学习)。
  这与系统设计的初衷有着典型的不同,主要是由于AI系统并没有被完美优化、抑或是由于设计定义意料之外的结果造成。
  当理想和现实产生巨大的差异时(AI系统不按照我们想象的方式运作),就需要解决规范定义的问题。
  在研究AI系统中规范定义问题时通常需要回答几个问题:我们如何设计出更为普遍的目标函数、并帮助主体发现运行时偏离目标的行为。
  理想与设计定义之间的差异主要源于设计的过程,而设计与实践间的差异则主要来源于实际运行的现场里。
  例如:在deepmind的AI安全论文里,对于强化学习的主体首先给予一个奖励函数来优化,但却在后台运行着一个安全表现评价函数。
  这显示了前述的差异:安全表现函数是理想的规范定义,而不完美的则是奖励函数(设计定义),而最终主体在实践过程中产生的结果则是结果策略的表现。
  另一个例子则是来自与OpenAI对于赛艇游戏CoastRunners训练强化学习过程的分析:
  对于大多数人类来说,我们的目标是尽快的完成比赛并超越其他玩家,这是我们对于这一任务的理想定义。但将这一目标精确地转换为奖励函数却不是一件容易的事情。
  由于这个游戏会奖励在行驶过程中击中一些目标的主体,所以通过强化学习训练出的主体会表现出令人惊讶的行为:它为了获得尽可能多的奖励,就会在一片水域中不断的兜圈,去击中更多的奖励目标而不是完成比赛。
  我们可以看到,其他的玩家都在赛道中向前驰骋,而强化学习训练出的主体却待在一个水域中兜圈子。
  研究人员推测,这也许是由于没有平衡好长期目标完成比赛和短期奖励兜圈子得分。
  这种情况并不少见,很多时候AI系统会寻找目标定义中的漏洞或者缺失来最大化奖励,生成了很多令人瞠目结舌的效果。
  二、鲁棒性:保证系统能够抵抗干扰
  这一特性将保证AI系统在安全阈值内能够在一定的扰动下持续稳定地运行。
  这是AI系统在真是世界中运行的固有危险,它经常会受到不可预测的、变化的环境影响。在面对未知的情况或对抗攻击时,AI系统必须能够保持鲁棒性才能避免系统受损或者被不怀好意地操控。
  有关AI系统鲁棒性的研究主要集中于:在条件和环境变化时保证AI主体在安全的范围内运行。
  实际情况中,可以通过两方面来实现:一方面可以通过避免危险,另一方面则可以通过强大的自愈和恢复能力来实现。
  安全领域中的分布偏移、对抗输入和不安全的探索等问题都可以归结到鲁棒性问题中来。
  为了更好地说明分布偏移所带来的挑战,想象一下扫地机器人通常都在没有宠物的房间里干活,突然有一天被放到了一个有宠物的房间里去,而且糟糕的是在工作的时候还遇上了一只可爱的小动物。怎么办?
  它从没有见到过宠物,不知道该怎么处理这种情况,于是它只能呆呆地给宠物洗了个澡,造成了不愉快的结果。
  这种情况就是一个由数据分布改变所造成的鲁棒性问题,测试场景和训练场景的数据分布产生了偏移。
  测试场景和训练场景不同,使得主体无法达到目标。
  而对抗输入则是一种特殊的分布偏移现象,它利用精心设计的输入来欺骗系统输出期望的结果。
  在上图中只通过了0。0078的差异噪声就是系统将输入从树懒识别成了赛车。
  不安全探索将会使得系统寻求最大化效益实现目标而不顾安全保证,主体会在环境中不顾安全后果的探索优化。一个危险的例子还是扫地机器人,它在优化擦地策略时将湿抹布碾过裸露的电源
  三、保险性:监控系统活动
  这一特性意味着我们可以理解并控制AI在运行时的操作,将成为AI安全的保证。
  尽管细心的AI工程师可以为系统写下很多的安全规则,但也很难在一开始穷尽所有的情况。为了给系统安上保险研究人员利用监控和强制执行来保证系统的安全。
  监控意味着使用各种各样的手段来监测系统,以便分析和预测系统的行为,包括了人工监控和自动化监控。
  而强制执行则意味着一些设计机制用于控制和限制系统的行为。包括可解释性和可中断性等问题都属于保险的范畴。
  AI系统无论是在本质和处理数据的方式上都与我们不尽相同。这就引出了可解释性的问题,需要良好设计的测量工具和协议来帮助人类测评AI系统所作决策的有效性和合理性。
  例如:医疗AI系统需要在做出诊断时给出它得到这一结论的过程,医生才能根据这些因素来判断诊断是否合理。
  此外,为了理解更为复杂的AI系统,我们需要利用机器思维理论(MachineTheoryofMind)来帮助我们构建系统的行为模型实现自动化分析。
  ToMNet发现了两种不同主体的亚种,并预测了他们的行为。
  在最后,我们要能够在必要的时候关闭AI系统,这就涉及到可中断性的要求。
  设计一个可靠的停机键是充满挑战的任务:一方面最大化奖励的AI系统会拥有很强的意图来避免停机的发生;同时如果打断过于频繁的话将会最终改变原始的任务,主体从这样非正常的情况中归纳出错误的经验。
  中断问题,人类的干预将改变系统原本的目标任务。
  四、展望
  我们创造了很多强大的技术在现在和未来将被用于很多关键的领域中。我们需要铭记在心的是,安全为中心的设计思维不仅在研发和部署的时候,更在这一技术被大规模应用的时候有着重要的影响。
  尽管现在用起来很方便,但当这一算法被不可逆地整合到重要的系统中时,如果没有严谨细致的设计,我们将无法有效的处理其中存在的问题。
  两个在程序语言发展过程中明显的例子:空指针和C语言中的gets()例程。
  如果早期的程序语言设计能够有安全的意识,虽然发展会缓慢一些,但今天的计算机安全问题将为得到极大的改善。
  现在研究人员们通过详尽的设计和思考,避免了类似问题和弱点的出现。希望这篇文章能够构建起一个安全问题的有效框架,在设计和研发系统时可以有效的避免安全问题。
  希望未来的系统不仅仅是看起来很安全,而是鲁棒的、可验证的安全,因为他们就会在安全思想指导下设计制造的。
  更多的资源请参考相关论文:
  AISafetyGridworlds:https:arxiv。orgpdf1711。09883。pdf
  https:medium。comdeepmindsafetyresearchbuildingsafeartificialintelligence52f5f75058f1

如果我是哈利波特我有许多没能实现的梦想,但如果我是哈利波特,这些梦想就一定能实现,首先,我会把我认为最最有意思的运动魁地奇,变成全世界最受欢迎的运动!让所有人都体验到骑着扫帚打魁地奇的美……世界上最大的鲸鱼蓝鲸体长米睾丸重达斤说到海洋中的巨无霸我们第一印象就会联想到鲸鱼这个庞然大物,那么你知道世界上最大的鲸鱼是哪个吗?关于鲸鱼的种类有很多,那么最大的鲸鱼有是谁呢?有多大呢?一条普通的鲸鱼都能长达十几……忍是一种智慧我始终认为,忍应当成为我们的人生智慧。就拿《林冲风雪山神庙》中的林冲来说,刺配沧州时,他依然尊称陷害自己的高俅为高太尉,将罪责揽到自己身上,称自己恶了高太尉,认为自己是罪……怎样的管理者能晋升管理学上有一个著名的彼得原理:在一个等级制度中,每个职工趋向于上升到他所不能胜任的地位。彼得原理和我们平日所能观察到的现实大致比较吻合:大多数管理者在经过一定的职业发展之后,就……我在长大大雁离开了暖巢,因为他学会了飞翔,春花钻出了沃土,因为她长大了要美丽。看着那日历一页一页地翻过,看着那时钟一圈一圈地转动,我意识到了一件事,它就是我在长大。而就有这么一件……我的祖国演讲稿亲爱的老师们,亲爱的同学们,大家好!今天我演讲的题目是《我的祖国》。我们的祖国人才济济,有为我们建立新中国的毛泽东。有为水稻之父袁隆平老爷爷还有写了许多优美诗句的伟大诗人……如何用命令提示符更改电脑密码命令提示符是操作系统自带的一个程序,用户能在里面输入命令,进行计算机控制。如果你想用它来更改电脑的密码,一定不要错过这篇文章。快速总结1。启动计算机,进入安全模式。……余秋雨闲散第一原文欣赏离开迈锡尼后,本应该直接去奥林匹亚,但路途太远,需要半路投宿纳夫里亚。这是甲个海滨小城,十九世纪希腊摆脱土耳其统治后曾一度把它作为首都。我们的司机苏格拉底对这座小城的道路不太熟……浅析如何抓好油田基层党支部建设工作摘要:中国石油在党中央十八大正确思想的指引下,经过40年艰苦卓绝的努力,取得了喜人的成绩。最近这些年,油田事业也跟着时代在不断进步发展中。本文分析了当前油田党支部建设所遇到的问……老王酒店查记录app(怎样查个人住宾馆信息)老王酒店查记录app(怎样查个人住宾馆信息)实践日子中酒店的入住记载怎样查?假定说你有入住宾馆记载,那么就能够直接进入处理网络去查询自己的一个个人信息,所以在……个人怎么查微信聊天记录(微信怎么看聊天记录)个人怎么查微信聊天记录(微信怎么看聊天记录)微信现已成为咱们最常用的谈天东西,由于微信的运用率非常高,咱们也常常会拾掇一下微信谈天记载和其他软件的缓存文件来腾出手机空间。……我家的阳台阳台虽小,植物不少。这句话形容我家的阳台,再合适不过了。阳台上不仅有植物,动物也有两只小龟霸占着阳台的一个角落。绿萝是阳台的一大主角。它是一种非常普通的植物,都说绿萝接地……
绿色环保活动总结【编辑说】绿色环保活动总结为好范文网的会员投稿推荐,但愿对你的学习工作带来帮助。开展绿色环保活动,助推实际,绿色环保、低碳生活走进我们的身边。你参加完活动之后有什么感想吗……脚气为什么容易反复发作夏天怎么预防脚气发作脚气为什么容易反复发作脚气易反复发作,主要有三个原因:1、真菌很难被杀灭在零下6左右的环境里能长期存活;在120的高温中,10分钟内不会死亡;在脱离活体的毛发……oppo同款手机查定位(如何查手机定位在哪)oppo同款手机查定位(如何查手机定位在哪)现在的社会,手机现已成为了万众随身的一种设备,它可以上网和联络朋友,可以作为人们的掌上电脑。现在的手机大多数都是智能化的……苹果为员工设计了专属口罩苹果公司以其简约精致的产品设计而感到自豪。因此,这也就不足为奇了,该公司对防护面罩的外观有自己的想法。彭博社周三报道称,苹果公司设计了特殊的口罩,并已开始将其分发给公司和……能不能查下手机定位在哪里?(手机位置怎么查踪迹)能不能查下手机定位在哪里?(手机位置怎么查踪迹)现在的社会,手机现已成为了万众随身的一种设备,它能够上网和联络朋友,能够作为人们的掌上电脑。现在的手机大多数都是智能……和女朋友在一起总是查位置(如何免费查手机定位)和女朋友在一起总是查位置(如何免费查手机定位)现在的社会,手机现已成为了万众随身的一种设备,它能够上网和联络朋友,能够作为人们的掌上电脑。现在的手机大多数都是智能化……哪个软件可以查微信聊天记录(怎么样查找聊天记录微信)哪个软件可以查微信聊天记录(怎么样查找聊天记录微信)微信现已成为咱们最常用的谈天东西,由于微信的运用率非常高,咱们也常常会拾掇一下微信谈天记载和其他软件的缓存文件来腾出手……埃及帝王谷与女王陵环球之旅我们在金字塔看到,古王国时期的法老为自己修建了一座座巨大的金字塔,试图通过这种巍峨的建筑来达到自己的永生。但是结局却出乎他们的预料。金字塔陵墓实在是太引人注目,虽然防范措施严密……上年纪的多情更易长寿amp;gt;amp;gt;amp;gt;推荐:老年人冬季饮食放红枣更健康友情多广泛一个人最怕的是孤独,孤独是老年人之大忌。与其在家守老营不如走出家门,广交朋友,尤其善交……浅述中国知网助构电力设计企业馆藏资源【摘要】本文从信息技术发展推动企业档案数字化出发,提出利用中国知网来充实丰富馆藏资源,特别介绍了中国知网及电力勘测设计知识服务平台特点、功能及比较评估,最后展望未来利用知识管理……十大食品添加剂的危害众所周知,含有大量食品添加剂和防腐剂的加工食品对人体健康是有百害无一利的。下面为大家介绍十大食品添加剂的危害。让大家了解这些食品添加剂过量的危害有哪些。1。钠比萨饼……魏丑夫是谁魏丑夫最后给芈月陪葬了吗魏丑夫是谁魏丑夫,战国时期秦宣太后的男宠。生卒年不详。食色,性也。这本是一个很明显也很正常的事情。男人见了美女总爱多看几眼,女人见了帅哥也难免怦然心动。男人爱看时装……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网