OpenAI发布安全指南:管理层可决定发布新AI模型,但董事会也有权阻止

2023-12-21
关注
摘要 OpenAI在其官网发布了一份名为“准备框架”的安全指南。

界面新闻记者 | 赵一帆

ChatGPT发布后AI技术快速发展,与之而来的则是对AI失控的担忧。全球监管机构都在抓紧制定管控AI风险的法规条款,OpenAI也发布了安全指南。

当地时间12月18日,OpenAI在其官网发布了一份名为“准备框架(Preparedness Framework)”的安全指南,以帮助跟踪、评估、预测和防范愈发强大的AI模型相关的风险。

值得注意的是,团队需要每月向一个新的内部安全咨询小组发送报告,该小组随后将对其进行分析,并向OpenAI首席执行官萨姆·奥尔特曼和董事会提交建议。奥尔特曼等公司领导层可以根据报告决定是否发布新的人工智能模型,但董事会也可以阻止其发布。

OpenAI解释称,对前沿人工智能风险的研究,远远没有达到相应的水平和需求。为了解决这一差距并使安全思维系统化,OpenAI正在采用“准备框架”的测试版本。 

在这份“准备框架”中,OpenAI提出了一系列方法,试图更安全地开发和部署前沿模型。

“准备团队”将针对四大问题持续测试并不断更新“记分卡”,主要包括网络安全问题、化学威胁、核威胁和生物威胁。在风险等级上,分为低、中、高或严重四个类级别,只有评级为“中”或以下级别的AI模型才能部署,只有评级为“高”或以下的模型,才能进一步开发。 

该团队是OpenAI建立的一个独立小组,以对技术工作和安全决策进行监督。该团队由麻省理工学院的可部署机器学习中心主任Aleksander Madry领导。OpenAI共有3个独立小组,此外还有负责如GPT-4邓产品的“安全系统”(safety systems)小组,以及关注未来可能诞生的强大人工智能的“超级对齐(superalignment)”小组。

此外,准备团队还将定期进行安全演习。OpenAI表示,这项工作从OpenAI外部人员中获得反馈,并由合格的独立第三方进行审核。OpenAI称将继续让其他人组成红队并评估我们的模型,并且计划与外部共享更新。  

同时,OpenAI将与外部各方以及安全系统等内部团队密切合作,以跟踪现实世界中的滥用情况。

上月OpenAI内部的“宫斗大战”吸引了全球的关注,作为OpenAI联合创始人之一的奥尔特曼曾一度离开公司。虽然最终得以重返并回归CEO一职,但当下“初始”董事会中仍没有他的位置。

您觉得本篇内容如何
评分

相关产品

CSMS 中科微感 人工智能+嗅觉传感器(AI-Nose) 气体传感器

中科微感逐步攻克了制约人工嗅觉传感发展的核心材料、硬件、算法等技术,开发出了以新型纳米敏感材料为基础,以微纳加工技术为支撑,以人工智能算法为核心的第一代 MEMS 基金属氧化物半导体原理的人工嗅觉传感器产这一产品将解决当前制约人工智能嗅觉技术与市场应用发展的关键问题:提供量产化的高一致、低成本、微型化的嗅觉传感器阵列硬件,以及提供标准化的人工智能+嗅觉气味感知软件平台,使客户能够快速构建和应用气味数据模型

XKCON 祥控 弹药库环境温湿度异常报警与智能监控系统 温湿度变送器

济南祥控自动化设备有限公司自主研发的XKCON祥控弹药库环境温湿度异常报警与智能监控系统采用物联网、传感器、大数据、人工智能等先进技术,能够对弹药库环境温湿度信息实现数字化、可视化管理。

山东美安 矿山电机车防追尾道岔口报警器 控制器及系统

煤矿用机车防追尾保护装置 机车防追尾保护装置是一种矿用人工智能保护装置、具有防追尾保护、无线触发沿途弯道语言保护、输出控制并记录等功能可广泛的使用在矿山井下、井上的运输机车上。

KEYENCE 基恩士 AI-1000C 图像匹配传感器

因此,人工智能系列能够在模式匹配的基础上对物体进行稳定的检测和识别,而这是基于强度或距离的传感器难以实现的。 基于强度或距离的传感器难以实现。

云传物联 水质生态浮标浮台在线测系统 多参数监测系统

电子水质监测解决方案利用信息控制与处理、人工智能、自动化、物联网及多媒体等技术,集水质参数在线采集、无线传输、智能处理、超限报警、远程管理等功能于一体的水质监测解决方案。

DINSEE 鼎信智慧科技 DX-WPS100-SP2... CMOS图像传感器

针对传统配电线路人工巡检效率低、周期长等问题,鼎信智慧结合物联网、红外热成像、人工智能等技术,研发了配电线路图像视频双光球机在线监测装置。

大立科技 DM60-W3 红外体温快速筛检

红外热成像体温快速筛检系统DM60-W3系列为384*288/640*480像素,人工智能算法,远距离、大场景测温更精准。

Maike 迈科光电 MK-PB4023PS&ALS&VC-A01E 接近传感器

EM30918、STK3311-X、STK3321、APDS-9900 ,9901、TMD2772WA、RPR0521RS、VCNL4035X01 WH4530A),广泛应用于平板电脑、工控显示类产品、智能家居、AI人工智能等场景,联想笔记本电脑,九安医疗的测温仪,微步数码的平板等都应用了我们这颗传感器,已量产批量出货。

Handsome 翰德圣 HDSELM V1.1 安全传感器和系统

设备全生命周期管理平台融合的物联网、云计算、大数据、人工智能、优化制造、再制造六项主流技术,通过云端模块化的架构可为企业灵活管理设备,不仅可以随时随地了解设备运行状态、发现故障隐患,还能够通过大数据分析指导企业维修

评论

您需要登录才可以回复|注册

提交评论

唐唐看科技

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

手机端生成模型爆发在即,芯片迎来巨变?

提取码
复制提取码
点击跳转至百度网盘