OpenAI发布安全指南:管理层可决定发布新AI模型,但董事会也有权阻止
永华财经
2024-03-09 14:06:17
0

  ChatGPT发布后AI技术快速发展,与之而来的则是对AI失控的担忧。全球监管机构都在抓紧制定管控AI风险的法规条款,OpenAI也发布了安全指南。

  当地时间12月18日,OpenAI在其官网发布了一份名为“准备框架(Preparedness Framework)”的安全指南,以帮助跟踪、评估、预测和防范愈发强大的AI模型相关的风险。

  值得注意的是,团队需要每月向一个新的内部安全咨询小组发送报告,该小组随后将对其进行分析,并向OpenAI首席执行官萨姆·奥尔特曼和董事会提交建议。奥尔特曼等公司领导层可以根据报告决定是否发布新的人工智能模型,但董事会也可以阻止其发布。

  OpenAI解释称,对前沿人工智能风险的研究,远远没有达到相应的水平和需求。为了解决这一差距并使安全思维系统化,OpenAI正在采用“准备框架”的测试版本。

  在这份“准备框架”中,OpenAI提出了一系列方法,试图更安全地开发和部署前沿模型。

  “准备团队”将针对四大问题持续测试并不断更新“记分卡”,主要包括网络安全问题、化学威胁、核威胁和生物威胁。在风险等级上,分为低、中、高或严重四个类级别,只有评级为“中”或以下级别的AI模型才能部署,只有评级为“高”或以下的模型,才能进一步开发。

  该团队是OpenAI建立的一个独立小组,以对技术工作和安全决策进行监督。该团队由麻省理工学院的可部署机器学习中心主任Aleksander Madry领导。OpenAI共有3个独立小组,此外还有负责如GPT-4邓产品的“安全系统”(safety systems)小组,以及关注未来可能诞生的强大人工智能的“超级对齐(superalignment)”小组。

  此外,准备团队还将定期进行安全演习。OpenAI表示,这项工作从OpenAI外部人员中获得反馈,并由合格的独立第三方进行审核。OpenAI称将继续让其他人组成红队并评估我们的模型,并且计划与外部共享更新。

  同时,OpenAI将与外部各方以及安全系统等内部团队密切合作,以跟踪现实世界中的滥用情况。

  上月OpenAI内部的“宫斗大战”吸引了全球的关注,作为OpenAI联合创始人之一的奥尔特曼曾一度离开公司。虽然最终得以重返并回归CEO一职,但当下“初始”董事会中仍没有他的位置。

相关内容

爱士惟科创板IPO终止 光...
  再有光伏产业链企业IPO告终。  11月30日上交所公告,因爱...
2024-04-25 11:06:05
“枫桥式”税务所展现治理新...
  近日,国家税务总局沁水县税务局龙港税务分局运用“上土炕、说土理...
2024-04-25 11:06:00
全球第二大钢企:预计钢铁需...
  当地时间周四,全球第二大钢铁制造商安赛乐米塔尔(Arcelor...
2024-04-25 11:05:57
航运板块强势拉升,海通发展...
  航运板块22日盘中强势拉升,截至发稿,海通发展涨停,宁波远洋、...
2024-04-25 11:05:53
【欧股收市】欧元区8月通胀...
汇通财经APP讯——财经报社(北美)讯 周四(8月31日),欧元区...
2024-03-09 14:06:31
监管“长牙带刺”:100天...
证券时报记者 张一帆在全面加强监管,防范化解风险的主基调下,据Wi...
2024-03-09 14:06:29

热门资讯

股票配资策略:巧妙运用平仓线规... 股票配资策略中,巧妙运用平仓线是一种规避市场波动风险的方法。平仓线是指在股票价格下跌到一定程度时,自...
MR概念异动拉升 亿道信息、中...   MR概念异动拉升,亿道信息、中光学涨停,创维数字、双象股份、五方光电、格林精密等纷纷冲高。
全球第二大钢企:预计钢铁需求今...   当地时间周四,全球第二大钢铁制造商安赛乐米塔尔(ArcelorMittal)公司表示,预计今年全...
OpenAI发布安全指南:管理...   ChatGPT发布后AI技术快速发展,与之而来的则是对AI失控的担忧。全球监管机构都在抓紧制定管...